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1 Introducción 


1.1  ¿Qué  es  la  teoría  de  juegos? 

La  teoría  de  juegos  es  una  herramienta  para  el  estudio  de  las  situaciones  de  interdependen- 
cia estratégica.  En  esta  pregunta  se  hace  una  primera  aproximación  a la  materia.  En  primer 
lugar,  se  describe  lo  que  se  entiende  por  una  situación  de  interdependencia  estratégica  y 
se  ponen  algunos  ejemplos,  prestando  especial  atención  a la  presencia  de  este  tipo  de  si- 
tuaciones en  la  economía.  En  segundo  lugar,  se  presentan  las  características  fundamentales 
de  su  método  de  trabajo  y se  explican  las  diferencias  entre  el  enfoque  cooperativo  y el  no 
cooperativo.  Por  último,  se  hace  una  breve  referencia  a su  desarrollo  histórico. 

1.1.1  Objeto 

La  teoría  de  juegos  tiene  por  objeto  de  estudio  las  situaciones  de  interdependencia  estratégica. 
En  este  tipo  de  situaciones  cada  uno  de  los  decisores  de  un  grupo  es  consciente  de  que  las 
consecuencias  de  su  decisión  dependen  de  las  que  tomen  los  demás.  El  nombre  de  teoría  de 
juegos  proviene  precisamente  del  hecho  de  que  muchas  de  las  situaciones  que  denomina- 
mos juegos  en  el  lenguaje  común,  son  situaciones  más  o menos  sencillas  de  interdependencia 
estratégica:  cada  jugador  tiene  que  decidir  que  hacer  sabiendo  que  dicha  elección  será  «bue- 
na» o «mala»  en  función  de  lo  que  hagan  los  demás.  En  esa  interacción  entre  los  jugadores 
desempeñan  un  papel  esencial  las  denominadas  reglas  de  juego,  que  son  las  que  determinan 
en  última  instancia  las  condiciones  en  que  deciden  los  jugadores  y las  consecuencias  de  sus 
decisiones. 

La  vida  social,  en  sus  distintos  ámbitos,  esta  llena  de  situaciones  en  las  que  se  produce  in- 
terdependencia entre  las  decisiones  de  distintos  individuos  u organizaciones  en  el  marco  de 
unas  determinadas  reglas  más  o menos  explícitas.  De  como  toman  esos  individuos  u organi- 
zaciones sus  decisiones,  y de  como  influyen  en  las  mismas  las  reglas  en  cuyo  marco  deciden, 
es  precisamente  de  lo  que  se  ocupa  la  teoría  de  juegos.  Debemos  considerarla,  por  tanto,  co- 
mo una  herramienta  capaz  de  ayudarnos  a comprender  que  factores  influyen  en  la  forma  en 
que  se  desarrollan  dichas  situaciones. 

Si  nos  preguntamos  por  la  utilidad  de  estudiar  teoría  de  juegos,  caben  varias  respuestas: 

■ para  ser  buenos  estrategas,  esto  es,  como  instrumento  que  nos  ayude  a elegir  la  estra- 
tegia óptima  en  las  distintas  situaciones  de  interdependencia  estratégica  en  que  nos 
veamos  involucrados; 

■ para  comprender  los  determinantes  del  comportamiento  de  los  decisores  en  las  distin- 
tas situaciones  de  interdependencia  estratégica  y,  a partir  de  ahí: 

• predecir  su  comportamiento  bajo  unas  determinadas  reglas; 
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• diseñar  marcos  de  interacción  (reglas)  en  el  que  las  estrategias  de  los  jugadores 
lleven  a los  resultados  deseados  ( diseño  de  mecanismos). 


Interdependencia  estratégica  y economía 

En  tanto  que  herramienta  para  el  análisis  de  las  situaciones  de  interdependencia  estratégica, 
la  teoría  de  juegos  no  sólo  es  utilizada  en  el  campo  de  la  economía,  sino  también  en  otros 
muchos  como  las  ciencias  políticas,  la  psicología,  el  derecho,  la  filosofía  e incluso  la  biología 
evolutiva  o la  informática.  Sin  embargo,  desde  sus  inicios  ha  sido  en  el  ámbito  de  la  eco- 
nomía donde  ha  presentado  un  mayor  desarrollo.  Aunque,  como  veremos  posteriormente, 
presenta  una  mayor  afinidad  con  la  microeconomía,  hoy  en  día  constituye  una  herramien- 
ta imprescindible  en  las  distintas  ramas  de  la  economía  (macroeconomía,  economía  de  la 
empresa,  finanzas,  economía  laboral,. . . ). 

Entendida  la  economía  como  la  ciencia  que  se  ocupa  de  como  canalizan  las  distintas  socie- 
dades las  fuerzas  que  se  derivan  de  la  escasez  de  recursos,  no  puede  sorprendernos  el  éxito 
que  en  ella  ha  tenido  el  uso  de  la  teoría  de  juegos.  Escasez  implica  conflicto  por  apropiarse 
de  lo  escaso,  pero  a la  vez  induce  a la  cooperación  en  la  medida  que  ésta  permite  un  mejor 
aprovechamiento  de  esos  recursos.  Precisamente  para  esto,  para  el  estudio  de  la  cooperación 
y del  conflicto,  es  para  lo  que  resulta  útil  la  teoría  de  juegos. 

La  potencialidad  del  uso  de  la  teoría  de  juegos  en  la  economía  se  pondrá  de  manifiesto  a 
medida  que  nos  vayamos  familiarizando  con  su  método  y a través  de  las  distintas  aplica- 
ciones que  iremos  viendo  a lo  largo  del  curso.  En  cualquier  caso,  resulta  inmediato  asociarla 
con  el  estudio  de  los  mercados  oligopolistas,  de  las  subastas,  de  la  negociación  colectiva, 

de  las  relaciones  comerciales  entre  países, La  interdependencia  estratégica  esta  presente 

prácticamente  en  todos  los  ámbitos  de  decisión  de  los  agentes  privados  y de  la  intervención 
pública  en  la  economía.  En  el  Ejercicio  1.1.1  se  pide  una  breve  reflexión  sobre  ello. 


► Ejercicio  1.1.1 

Ponga  algún  ejemplo  de  situación  de  interdependencia  estratégica  relacionado  con: 

■ los  distintos  ámbitos  de  decisión  de  las  empresas  (con  sus  clientes,  con  sus  traba- 
jadores, con  sus  competidores,. . . ) 

■ los  distintos  ámbitos  de  decisión  de  los  ciudadanos  (como  consumidores  o usua- 
rios, como  trabajadores,  como  contribuyentes,  como  votantes,. . . ) 

■ los  distintos  ámbitos  de  intervención  pública  en  la  economía  (regulación,  política 
fiscal,  política  monetaria, . . . ) 
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1.1.2  Método 

La  forma  de  trabajar  en  la  teoría  de  juegos  consiste  básicamente  en  la  elaboración  y manejo 
de  un  tipo  especial  de  modelos  que  se  denomina  genéricamente  juego.  Un  juego  es,  por  tan- 
to, un  modelo  de  una  situación  de  interdependencia  estratégica.  Como  ocurre  con  cualquier 
otro  modelo,  el  objetivo  es  utilizar  un  proceso  de  abstracción  que  nos  lleve  de  la  situación 
real  a un  sistema  de  relaciones  más  sencillo,  pero  más  claro  y preciso,  en  cuyo  marco  se  ve- 
rá facilitado  el  análisis  deductivo.  Cuando  trabajamos  con  nuestros  modelos,  esperamos  que 
nos  permitan  descubrir  alguna  de  las  fuerzas  subyacentes  a la  situación  real  de  interdepen- 
dencia estratégica  que  de  otro  modo  podrían  pasarnos  desapercibidas.  Evidentemente,  los 
resultados  derivados  del  modelo  requieren  de  una  interpretación  para  ser  aplicados  a la  si- 
tuación real  que  pretende  representar,  en  la  que  siempre  actuarán  otras  fuerzas  que  hemos 
pasado  por  alto  en  la  construcción  y manejo  del  modelo. 

Aunque  en  estos  apuntes  se  pone  el  énfasis  en  las  aplicaciones  de  la  teoría  de  juegos  (en 
especial  al  ámbito  de  la  economía),  debemos  señalar  que  la  teoría  de  juegos  es  considerada 
como  una  rama  de  las  matemáticas.  El  uso  de  las  matemáticas  nos  obliga  a la  definición 
precisa  de  los  conceptos  y de  los  supuestos  de  partida,  a la  vez  que  nos  facilita  el  proceso 
deductivo  que  nos  lleva  de  esos  supuestos  a una  serie  de  conclusiones  consistentes  con  los 
mismos. 

Aunque,  como  ya  hemos  señalado  en  el  apartado  anterior,  hoy  en  día  la  teoría  de  juegos  se 
utiliza  prácticamente  en  todas  la  ramas  de  la  economía,  presenta  una  mayor  afinidad  con  el 
análisis  microeconómico  . El  principio  del  individualismo  metodológico,  tan  característico  de 
la  microeconomía,  esta  implícito  también  en  buena  parte  de  la  teoría  de  juegos.  El  supues- 
to de  racionalidad  en  la  toma  de  decisiones  y el  concepto  de  equilibrio  están  presentes  en  la 
mayor  parte  de  los  juegos  que  analizaremos,  de  la  misma  manera  que  lo  estaban  en  los  mo- 
delos microeconómicos  ya  vistos.  El  análisis  del  funcionamiento  de  las  estructuras  básicas 
de  mercado  constituye  un  buen  ejemplo  de  ello.  Los  modelos  básicos  de  competencia  per- 
fecta y monopolio  tienen  en  común  la  ausencia  de  interdependencia  estratégica;  en  el  caso 
del  monopolio  por  la  presencia  de  un  único  oferente  y en  el  de  la  competencia  perfecta  por 
el  supuesto  de  atomismo  de  los  agentes.  El  recurso  a la  teoría  de  juegos  surge  de  manera  na- 
tural al  tratar  de  extender  este  tipo  de  modelos  a una  situación  en  con  un  número  reducido 
de  oferentes,  cada  uno  de  ellos  consciente  de  que  sus  resultados  dependen  de  lo  que  haga  el 
resto. 

Dos  enfoques  distintos:  juegos  cooperativos  frente  a juegos  no  cooperativos 

Los  modelos  de  la  teoría  de  juegos  se  agrupan  en  dos  grandes  grupos,  cada  uno  de  los  cuales 
adopta  un  enfoque  diferente  a la  hora  de  analizar  las  situaciones  de  interdependencia  estra- 
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tégica.  Los  denominados  juegos  no  cooperativos,  son  modelos  en  los  que  se  parte  de  una  espe- 
cificación detallada  de  las  condiciones  en  las  que  deciden  los  jugadores  (las  reglas  del  juego) 
y el  objetivo  es  analizar  el  comportamiento  que  cabe  esperar  por  parte  de  cada  uno  de  ellos. 
En  los  denominados  juegos  cooperativos,  se  parte  de  de  la  especificación  de  los  resultados  que 
obtendrían  las  posibles  coaliciones  de  jugadores  y el  objetivo  es  tratar  de  analizar  cuáles  de 
ellas  cabe  esperar  que  se  sostengan  de  acuerdo  con  determinados  criterios.  Podríamos  decir 
que,  mientras  la  teoría  de  los  juegos  no  cooperativos  se  centra  más  en  el  procedimiento  (en 
como  deciden  los  jugadores),  la  teoría  de  los  juegos  cooperativos  se  centra  más  en  los  re- 
sultados, sin  entrar  en  detalles  sobre  cómo  se  alcanzarán.  La  denominación  utilizada  puede 
llevar  a confusión,  ya  que  en  la  cooperación  es  objeto  de  estudio  de  los  juegos  no  coopera- 
tivos, de  la  misma  manera  que  la  competencia  entre  los  jugadores  está  presente  en  muchos 
juegos  cooperativos.  Lo  importante  es  recordar  que  son  dos  maneras  distintas  de  enfocar 
las  situaciones  de  interdependencia  estratégica.  El  Ejemplo  1.1.1  presenta  un  juego  sencillo 
construido  bajo  el  enfoque  no  cooperativo  y el  Ejemplo  1.1.2  uno  construido  bajo  el  enfo- 
que cooperativo.  La  asignatura  se  centra  en  el  estudio  de  los  juegos  no  cooperativos  y sus 
aplicaciones  a la  economía,  si  bien  en  el  Tema  7 se  hace  una  breve  introducción  al  enfoque 
cooperativo. 


Ejemplo  1.1.1  (Un  juego  no  cooperativo:  modelo  de  localización  espacial  de  Hote- 
lling) 

El  economista  Harold  Hotelling  planteó  en  1929  un  modelo  de  localización  espacial  que 
ha  alcanzado  posteriormente  una  gran  popularidad0.  En  dicho  modelo,  Hotelling  plan- 
teaba una  situación  en  la  cual  dos  empresas  que  vendían  un  producto  homogéneo  a un 
precio  dado  tenían  que  decidir  donde  localizarse  a lo  largo  de  una  ciudad  lineal,  cuya 
longitud  puede  normalizarse,  sin  pérdida  de  generalidad,  a la  unidad.  Se  supone  tam- 
bién que  los  consumidores  están  uniformemente  distribuidos  a lo  largo  de  la  misma 
y tienen  demandas  unitarias  (deciden  a que  empresa  compran  una  única  unidad  del 
bien).  Los  consumidores  incurren  en  un  coste  de  transporte  o de  desplazamiento  por  lo 
que  comprarán  a la  empresa  que  tengan  más  cerca.  Si  las  dos  empresas  eligen  la  misma 
ubicación  cada  una  de  ellas  abastecerá  a la  mitad  de  los  consumidores. 

A B 


Figura  1.1.  Modelo  de  ciudad  lineal  de  Hotelling  con  dos  empresas. 

Bajo  determinadas  condiciones,  no  demasiado  restrictivas,  la  idea  de  equilibrio,  enten- 
dido como  situación  en  la  cual  ambas  empresas  están  satisfechas  con  su  localización,  es 
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sufiente  para  «resolver»  este  juego.  En  efecto,  sólo  existe  una  localización  posible  en  la 
que  se  cumpla  que  ninguna  de  ellas  querrá  moverse  si  la  otra  no  lo  hace:  cuando  ambas 
se  sitúan  en  el  centro  de  la  ciudad.  ¿Para  que  nos  sirve  este  modelo?  Para  identificar 
una  fuerza  importante  que  influirá  en  situaciones  parecidas  a ésta  y que  se  conoce  como 
principio  de  diferenciación  mínima.  No  se  pretende  en  ningún  caso  que  el  modelo  recoja 
perfectamente  la  situación  real  en  toda  su  complejidad  ni,  por  tanto,  tampoco  que  la 
explique  de  manera  perfecta.  El  proceso  de  abstracción  implícito  en  la  construcción  del 
modelo  y el  proceso  deductivo  basado  en  el  concepto  de  equilibrio,  constituyen  conjun- 
tamente una  herramienta  útil  en  tanto  nos  permite  descubrir  fuerzas  que  operan  en  las 
situaciones  reales  y que  de  otra  manera  nos  pasarían  desapercibidas.  Una  vez  identifica- 
das esas  fuerzas,  queda  la  tarea  de  valorar  su  influencia  en  situaciones  reales  concretas. 
Si  el  modelo  de  localización  de  Hotelling  ha  tenido  éxito,  es  porque  de  una  manera  muy 
sencilla  pone  de  manifiesto  una  fuerza  que  esta  presente  en  muchas  situaciones  reales 
(programas  de  partidos  políticos,  localización  de  las  gasolineras  a lo  largo  de  una  au- 
topista, horarios  de  salida  de  distintos  medios  de  transporte,  programación  cadenas  de 
televisión,. . . ). 

'’Hotelling,  H.  (1929).  The  stability  of  competition.  The  Economic  Journal,  39(153),  41-57. 


Ejemplo  1.1.2  (Un  juego  cooperativo:  modelo  de  emparejamientos  estables  de  Gale- 
Shapley) 

El  premio  nobel  de  Economía  correspondiente  al  año  2012  se  otorgó  conjuntamente  a los 
economistas  matemáticos  Alvin  E.  Roth  y Lloyd  S.  Shapley  «for  the  theory  of  stable  allo- 
cations  and  the  practice  ofmarket  design»a.  El  ejemplo  que  proponemos  aquí  esta  tomado 
de  un  artículo,  publicado  hace  50  años,  del  que  Shapley  es  coautor  y que  es  considerado 
como  una  de  sus  aportaciones  más  relevantes^.  Los  autores  plantean  una  situación  en 
la  cual  se  desea  formar  parejas  a partir  de  un  conjunto  de  tres  hombres  a,  f>  y 7 y tres 
mujeres  A,  B y C,  cuyas  preferencias  vienen  recogidas  en  la  siguiente  matriz: 


A 

B 

C 

l X 

1,3 

2,2 

3,1 

p 

3,1 

1,3 

2,2 

7 

2,2 

3,1 

1,3 

Figura  1.2.  Matriz  de  preferencias  del  ejemplo  de  Gale-Shapley 


De  entre  todas  las  posibles  formas  de  emparejamiento,  se  plantean  como  objetivo  la  exis- 
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tencia  e identificación  de  aquellas  que  sean  estables  y óptimas  en  un  sentido  que  ellos  mis- 
mos definen.  Consideran  un  conjunto  de  emparejamientos  inestable  si,  dadas  las  parejas 
formadas,  existe  al  menos  un  hombre  i y una  mujer  j que  no  están  emparejados  entre 
sí  y,  sin  embargo,  ambos  preferirían  al  otro  antes  que  a su  actual  pareja.  Los  autores 
demuestran  en  el  artículo  que  siempre  existe  al  menos  una  forma  de  emparejamientos 
que  es  estable  y proponen  un  «mecanismo  de  aceptación  diferida»  que  siempre  permite  se- 
leccionar un  conjunto  de  emparejamientos  que  que  será  estable.  Este  mecanismo  se  ha 
utilizado  posteriormente  para  asignar  médicos  internos  a hospitales,  alumnos  a cole- 
gios, deportistas  a equipos, El  mecanismo  propuesto  (fácilmente  implementable  en 

una  aplicación  informática)  consistiría  en  proceder  de  la  siguiente  forma: 

■’aso  1:  Cada  hombre  hace  una  petición  de  matrimonio  a una  mujer.  Cada  mujer  acepta 
temporalmente  la  propuesta  más  preferida  de  entre  todas  las  que  le  llegan. 

^aso  k:  Cada  hombre  que  no  haya  sido  aceptado  en  la  etapa  anterior  hace  una  propuesta 
a la  mujer  preferida  de  entre  las  que  no  lo  hayan  rechazado  previamente. 

arada:  El  proceso  finaliza  cuando  todos  los  hombres  han  visto  aceptada  una  propuesta. 

El  mecanismo  se  puede  aplicar  de  manera  idéntica  haciendo  que  sean  las  mujeres  las  que 
proponen  primero.  Los  autores  también  demuestran  que  el  emparejamiento  selecciona- 
do por  su  algoritmo  será  óptimo  para  la  parte  que  realiza  las  propuestas,  en  el  sentido 
de  que  cada  uno  de  sus  miembros  estará  al  menos  tan  bien  como  lo  estaría  en  cualquier 
otro  emparejamiento  estable.  Se  deja  como  ejercicio  la  determinación  del  conjunto  de 
emparejamientos  que  sería  seleccionado  en  cada  caso  para  las  preferencias  recogidas  en 
la  Figura  1.2. 

"El  siguiente  enlace  proporciona  información  adicional  sobre  las  aportaciones  por  las  que  les  ha  sido 
concedido  el  galardón: 

http : / / www.nobelprize.org  / nobel_prizes  / economics  / laureates  / 20 1 2 / advanced-economicsciences20 1 2 . 
pdf . 

!’Gale,  D.  y Shapley,  L.  (1962).  College  admissions  and  the  stability  of  marriage.  The  American  Mathe- 
matican  Monthly,  69(1),  9-15. 


1.1.3  Breve  referencia  histórica 

Aunque  detrás  de  muchos  de  los  desarrollos  actuales  de  la  teoría  de  juegos  se  encuentran 
aportaciones  que  se  remontan  al  siglo  XVIII  e incluso  antes  \ el  embrión  de  lo  que  es  hoy 
en  día  la  teoría  de  juegos  comenzó  a formarse  en  los  años  20  del  siglo  pasado.  De  esta  pri- 
mera etapa  destacan  las  contribuciones  de  los  matemáticos  Émile  Borel  (1871-1956)  y John 
von  Neumann  (1903-57).  Precisamente  este  autor,  junto  con  el  economista  Oskar  Morgens- 

1Para  una  presentación  esquemática  puede  consultar  la  página  web  An  Outline  of  the  History  of  Game 
Theory.http: / / www.econ.canterbury.ac.nz/ personal_pages/ paul_walker/ gt/hist.htm  . 
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ter  (1902-76),  sentaron  las  bases  para  el  posterior  desarrollo  de  la  disciplina  con  la  publica- 
ción en  1944  de  la  obra  Theory  ofGames  and  Economic  Behavionr2.  Poco  después  John  F.  Nash 
(1928-)  realizó  una  serie  de  aportaciones  que  serían  cruciales  para  el  desarrollo  posterior  de 
la  disciplina,  en  particular  el  concepto  de  equilibrio  de  Nash3. 


2Von  Neumann  y Morgenstern,  1944. 

3 Para  ver  la  transcendencia  del  concepto  de  equilibrio  de  Nash  en  la  historia  de  la  teoría  económica  puede 
consultarse  la  siguiente  referencia  bibliográfica:  Myerson,  R.  B.  (1999).  Nash  equilibrium  and  the  history  of 
economic  theory.  Journal  of  Economic  Literature,  37(3),  1067-1082. 
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1.2  Juegos  no  cooperativos:  estructura  y formas  de  representación 

1.2.1  Juegos  no  cooperativos:  estructura  y tipos 

La  formulación  adecuada  de  un  modelo  en  teoría  de  juegos  bajo  el  enfoque  no  cooperativo 
requiere  hacer  explícitos  los  siguientes  elementos: 

1.  El  conjunto  de  jugadores.  Supondremos  que  este  conjunto  es  finito  y que  consta  de 
n jugadores  propiamente  dichos  y de  un  pseudojugador  «0»  al  que  nos  referiremos 
como  la  naturaleza : 

/ = {0,1,2,  - - - ,n}. 

La  inclusión  de  la  naturaleza  permite  incorporar  al  modelo  factores  que  influyen  en 
el  desarrollo  del  juego  pero  que  no  son  controlables  por  ninguno  de  los  jugadores.  Un 
movimiento  de  la  naturaleza  consistirá  en  la  realización  de  uno  de  los  distintos  esta- 
dos de  la  naturaleza  posible,  cada  uno  de  los  cuales  puede  darse  con  una  determinada 
probabilidad. 

2.  Las  reglas  del  juego.  Establecerán  de  manera  precisa: 

■ el  orden  en  que  ha  de  mover  cada  jugador,  así  como  las  acciones  que  estarán  a su 
alcance  y la  información  disponible  cada  vez  que  le  toque  mover. 

■ la  relación  entre  los  posibles  desarrollos  del  juego  y los  resultados  obtenidos  por 
cada  jugador. 

La  especificación  adecuada  de  las  reglas  del  juego  constituye  un  elemento  clave  en  la 
elaboración  del  modelo  (del  juego). 

3.  Las  preferencias  de  los  jugadores  en  relación  a los  desarrollos  posibles  del  juego. 

Como  se  acaba  desarrollando  un  juego  depende  de  las  decisiones  del  conjunto  de  ju- 
gadores (incluidos  los  movimientos  de  la  naturaleza),  por  lo  que  indirectamente  también 
supondrá  la  existencia  de  una  relación  de  preferencias  sobre  las  distintas  combina- 
ciones posibles  de  decisiones.  Normalmente  representaremos  numéricamente  dichas 
preferencias  a través  de  una  función  que  denominaremos  función  de  pagos. 


Tipos  de  juegos  no  cooperativos 

La  primera  gran  clasificación  dentro  de  los  juegos  no  cooperativos  se  hace  a partir  del 
tipo  de  información  que  tienen  los  jugadores  sobre  la  estructura  del  juego  (conjunto  de 
jugadores,  reglas  del  juego  y preferencias  de  cada  jugador).  Se  dice  que  un  juego  es  de 
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información  completa  cuando  la  estructura  del  juego  es  conocimiento  común4:  todos 
los  jugadores  la  conocen,  todos  saben  que  todos  los  jugadores  la  conocen,  todos  saben 

que  todos  saben  que  todos  la  conocen, Por  oposición,  se  dice  que  un  juego  es  de 

información  incompleta  cuando  no  se  cumple  alguna  de  las  condiciones  anteriores. 
La  forma  más  habitual  de  incorporar  la  información  incompleta  es  a partir  de  algún 
de  tipo  de  imperfección  que  hace  que  las  preferencias  de  los  jugadores  no  sean  cono- 
cimiento común  (algún  jugador  no  conoce  la  función  de  pagos  del  otro,  algún  jugador 
no  sabe  si  los  otros  conocen  su  función  de  pagos,. . . ). 

Tomando  de  nuevo  como  referencia  la  información  disponible  por  lo  jugadores,  pero 
en  este  caso  en  relación  a los  movimientos  del  resto  de  jugadores,  se  distingue  entre 
juegos  de  información  perfecta  (cada  jugador  conoce  perfectamente  los  movimientos 
previos  de  otros  jugadores  cada  vez  que  le  toca  mover)  y juegos  de  información  im- 
perfecta (algún  jugador  ha  de  realizar  un  movimiento  sin  conocer  la  elección  de  algún 
otro). 

Como  se  verá  en  su  momento,  la  denominada  transformación  de  Harsanyi  permite 
convertir  los  juegos  de  información  incompleta  en  juegos  de  información  imperfecta. 

Además  de  las  clasificaciones  anteriores,  asociadas  a la  información  disponible  por  los 
jugadores,  existen  otras  muchas  entre  las  que  cabe  mencionar  las  siguientes: 

■ Juegos  de  suma  cero  (o  estrictamente  competitivos)  frente  a juegos  de  suma  no 
nula.  En  los  juegos  de  suma  cero  las  ganancias  de  un  agente  son  siempre  a costa 
de  las  pérdidas  del  otro.  Este  tipo  de  juegos  desempeño  un  papel  fundamental 
en  el  desarrollo  teórico  inicial  de  la  teoría  de  juegos,  aunque  poco  a poco  han  ido 
perdiendo  protagonismo  debido  a la  mayor  relevancia  práctica  de  los  juegos  de 
suma  no  nula. 

■ Juegos  estáticos  frente  a juegos  dinámicos.  En  los  juegos  estáticos  los  jugadores 
eligen  una  sola  vez  y de  forma  simultánea  (constan  de  una  sola  etapa),  por  lo 
que  se  trata  siempre  de  juegos  con  información  imperfecta.  Por  el  contrario,  en 
los  juegos  dinámicos  o multietápicos  almenos  un  jugador  acumula  información 
sobre  la  decisión  previa  de  otro  u otros  jugadores. 


4Cuando  determinada  información  es  conocida  por  todas  las  partes  se  dice  que  es  conocimiento  mutuo. 
El  conocimiento  mutuo  es  una  condición  necesaria  pero  no  suficiente  para  que  se  de  el  conocimiento  común. 
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1.2.2  Formas  de  representación 

De  cara  a facilitar  el  análisis  teórico  se  recurre  a dos  formas  de  presentación  de  la  informa- 
ción relativa  a la  estructura  del  juego  (jugadores,  reglas  y funciones  de  pagos)  conocidas 
respectivamente  como  forma  extensiva  y forma  normal  o forma  estratégica. 

La  representación  en  forma  extensiva 

La  representación  en  forma  extensiva  consiste  en  una  descripción  detallada  de  la  estructura 
secuencial  de  la  toma  de  decisiones  por  parte  de  los  jugadores  y se  desarrolla  a partir  del 
concepto  teórico  conocido  como  árbol  del  juego5.  En  este  tema  nos  limitamos  a presentar  de 
manera  informal  la  representación  en  forma  extensiva  mediante  algunos  ejemplos,  dejando 
para  más  adelante  la  definición  formal  de  la  misma. 


Ejemplo  1.2.1  Votaciones  estratégicas 

Dos  individuos  I y II  han  de  decidir  cual  de  entre  tres  proyectos  públicos.  A,  B ó C , se 
lleva  a cabo.  Las  preferencias  de  los  jugadores  son:  A y ¡ B y ¡ C;  B y ¡j  A y ¡j  C y el 
procedimiento  para  la  elección  es  el  siguiente:  cada  individuo  tiene  el  derecho  a vetar 
uno  de  los  proyectos,  haciéndolo  en  primer  lugar  el  7 y a continuación  el  II. 

La  representación  en  forma  extensiva  de  este  juego  aparece  recogida  en  la  Figura  1.3. 
El  árbol  del  juego  permite  recoger  toda  la  información  concerniente  a la  estructura  del 
juego: 

■ Quienes  son  los  jugadores  (encima  de  cada  nodo  aparece  el  nombre  del  jugador  al 
que  le  toca  elegir  entre  las  ramas  que  salen  del  mismo). 

■ El  orden  en  el  que  mueven  (el  I en  el  nodo  raíz  y el  77  a continuación),  las  alternativas 
de  que  disponen  cada  vez  que  les  toca  mover  (las  ramas  que  salen  del  nodo  corres- 
pondiente) y la  información  de  que  disponen  cada  vez  que  les  toca  mover  (el  77  tendrá 
que  decidir  sabiendo  que  proyecto  a vetado  el  7). 

■ Las  preferencias  de  los  jugadores,  esto  es,  su  valoración  de  los  posibles  desarrollos 
del  juego.  En  este  caso,  a cada  uno  de  los  seis  posibles  desarrollos  (trayectorias  po- 
sibles desde  el  nodo  raíz  hasta  los  nodos  terminales)  le  hemos  asociado  un  vector 
con  dos  componentes.  El  primero  de  ellos  representa  la  valoración  del  jugador  7 
y el  segundo  la  del  jugador  77.  Para  representar  numéricamente  las  preferencias 
de  ambos  jugadores  hemos  adoptado  el  convenio  de  asignar  un  2 al  proyecto  más 


5En  matemáticas  el  concepto  de  árbol  hace  referencia  a un  tipo  especial  de  grafo  (un  conjunto  de  nodos  y un 
conjunto  de  ramas  que  establecen  relaciones  entre  dichos  nodos)  en  el  que  no  existen  ciclos  ni  nodos  inconexos. 


Prof.  Pedro  Álvarez  Caúselo 

Departamento  de  Economía  - Universidad  de  Cantabria 


12 


Apuntes  de  Teoría  de  Juegos  - Curso  2012-2013 
Material  publicado  bajo  licencia  Creative  Commons 


1 Introducción 


preferido,  un  1 al  segundo  más  preferido  y un  0 al  menos  preferido. 


(0,0) 

(1,2) 

(0,0) 

(2,1) 

(1,2) 

(2,1) 


Figura  1.3.  Votaciones  estratégicas:  el  árbol  del  juego  . 


Ejemplo  1.2.2 

Dos  individuos,  I y II,  se  enfrentan  al  siguiente  juego.  Dada  una  baraja  de  40  cartas,  la 
mitad  de  las  cuales  son  rojas  y la  otra  mitad  negra,  el  individuo  I ha  de  elegir  una  de 
ellas  al  azar  pudiendo  mirar  él  su  color  pero  no  el  jugador  II.  A continuación  I tiene  dos 
opciones: 

1.  Enseñar  la  carta.  I recibirá  10  € de  II  si  es  roja,  pero  se  los  tendrá  que  pagar  si  es 
negra. 

2.  Hacer  un  envite  doblando  la  apuesta.  En  este  caso  II  tiene  a su  vez  dos  opciones: 

■ Aceptar  el  envite,  en  cuyo  I tendrá  que  darle  20  € si  la  carta  es  negra,  pero 
será  el  quien  tendrá  que  darle  20  € si  es  roja. 

■ No  aceptar  el  envite  y pagar  10  € a I. 

La  representación  en  forma  extensiva  de  este  juego  aparece  recogida  en  la  Figura  1.4.  El 
juego  empieza  en  el  nodo  raíz  que  en  este  caso  es  un  nodo  de  azar  ya  que  es  la  naturaleza  la 
que  elige  entre  dos  estados  posibles:  color  rojo  o color  negro.  Cada  uno  de  estos  estados 
viene  representado  por  una  rama  en  la  que  se  hace  constar,  además,  la  probabilidad  del 
estado  asociado.  Al  final  de  cada  una  de  esas  dos  ramas  aparece  un  nodo  de  decisión  en 
el  que  es  el  jugador  I el  que  decide  si  enseña  la  carta  o hace  un  envite,  opciones  que 
aparecen  representadas  por  las  ramas  L y L.  En  el  caso  de  que  I elija  L,  sea  cual  sea  el 
estado  de  la  naturaleza,  se  acaba  el  juego.  El  nodo  terminal  asociado  al  desarrollo  del  jue- 
go RL  recoge  mediante  un  vector  los  pagos  de  los  dos  jugadores;  el  primer  componente 
es  el  pago  del  jugador  I y el  segundo  el  del  II.  Lo  mismo  ocurre  con  el  nodo  terminal 
asociado  al  desarrollo  NL  aunque,  lógicamente,  los  pagos  son  distintos.  En  el  caso  en 


Prof.  Pedro  Álvarez  Caúselo 

Departamento  de  Economía  - Universidad  de  Cantabria 


13 


Apuntes  de  Teoría  de  Juegos  - Curso  2012-2013 
Material  publicado  bajo  licencia  Creative  Commons 


1.2.2.  Formas  de  representación 


que  uno  decide  hacer  un  envite,  y sea  cual  sea  de  nuevo  el  movimiento  de  la  naturaleza, 
aparece  un  nodo  de  decisión  asociado  al  jugador  II  que  ha  de  decidir  si  lo  acepta  o no. 
En  cualquiera  de  los  casos  el  juego  termina  y de  nuevo  aparecen  los  pagos  asociados  a 
los  respectivos  nodos  terminales. 


Aunque  pudiera  parecer  que  ya  esta  descrita  la  estructura  del  juego,  no  es  así  ya  que 
no  se  ha  hecho  explícita  la  información  de  que  disponen  los  jugadores  en  el  momento 
en  que  les  toca  mover.  En  concreto,  el  jugador  II  tendrá  que  tomar  su  decisión  sin  saber 
cual  es  el  estado  de  la  naturaleza.  Para  recoger  esto  se  utiliza  el  concepto  de  conjunto  de 
información  que  se  corresponde  con  un  conjunto  de  nodos  con  la  propiedad  de  que  el 
jugador  al  que  pertenece  dicho  conjunto  de  información  no  sabe  en  cuál  de  ellos  está. 
En  la  representación  gráfica  suele  recogerse  esa  falta  de  información  trazando  una  línea 
que  englobe  todos  los  nodos  de  un  mismo  conjunto  de  información.  Los  conjuntos  de 
información  de  un  jugador  ofrecen  una  lista,  desde  el  punto  de  vista  del  jugador  a que 
corresponden,  de  todas  las  posibles  situaciones  o circunstancias  en  las  que  puede  tener 
que  tomar  una  decisión.  En  el  ejemplo  que  estamos  considerando  el  jugador  II  tiene  un 
único  conjunto  de  información  que  consta  de  dos  nodos,  lo  que  refleja  la  situación  de 
que  en  el  caso  de  que  tenga  que  elegir  no  sabrá  si  la  carta  es  roja  o negra. 

Definición  1.2.1  Un  juego  es  de  información  perfecta  si  todos  los  conjuntos  de  información  cons- 
tan de  un  tínico  elemento.  En  caso  contrario  es  de  información  imperfecta. 

La  representación  mediante  el  árbol  del  juego  deja  de  ser  práctica  a medida  que  la  estruc- 
tura de  los  juegos  se  vuelve  más  compleja,  aunque  siempre  resulta  útil  hacer  un  esbozo  del 
mismo. 
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Ejemplo  1.2.3 

A dos  individuos  se  les  ofrece  la  posibilidad  de  repartirse  10.000  um  de  acuerdo  con  el 
siguiente  procedimiento.  En  primer  lugar  el  individuo  I hace  una  propuesta,  si  el  II  la 
acepta  se  lleva  a cabo,  en  caso  contrario  se  pierden  4.000  um  y es  el  II  el  que  hace  una 
propuesta  decidiendo  el  I si  la  acepta  o no.  Si  la  acepta  se  lleva  a cabo  y en  caso  contrario 
ninguno  recibe  nada. 


La  representación  en  forma  normal  o estratégica 

Aunque  la  forma  extensiva  ofrece  una  descripción  detallada  de  la  situación  de  interdepen- 
dencia estratégica,  en  muchas  ocasiones  resulta  útil  una  descripción  más  compacta  a partir 
de  la  denominada  representación  en  forma  normal  o estratégica.  La  relación  entre  la  forma 
extensiva  y la  forma  estratégica  queda  establecida  a partir  del  concepto  de  estrategia. 

Definición  1.2.2  Una  estrategia  para  el  jugador  i es  un  plan  de  acción  que  le  asigna  un  movimiento 
en  cada  una  de  las  situaciones  en  las  que  le  puede  tocar  mover,  esto  es,  en  cada  uno  de  sus  conjuntos 
de  información. 

Dado  este  concepto  de  estrategia,  un  juego  en  forma  extensiva  admite  una  representación 
más  compacta  en  la  que  únicamente  es  necesario  hacer  constar  los  siguientes  elementos: 

1.  El  conjunto  de  jugadores 

2.  Los  espacios  de  estrategias  de  cada  uno  de  los  jugadores 

3.  Las  funciones  de  ganancias  o pagos  de  cada  jugador 

La  representación  en  forma  normal  de  un  juego  queda  caracterizada  por: 

Esta  representación  se  conoce  como  forma  normal  o estrátegica  y nos  referiremos  a ella  más 
formalmente  como: 


(1.1) 


donde  S¿  es  el  espacio  de  estrategias  del  jugador  i,  y donde  las  funciones  de  ganancias  aso- 
cian a cada  posible  combinación  de  estrategias  s el  pago  que  recibe  el  jugador  correspon- 
diente: 


U,  : S ->•  R 


s i y Uf  s). 


La  representación  en  forma  normal  recoge  en  la  complejidad  de  las  estrategias  la  falta  de 
detalle  que  supone  respecto  a la  representación  en  forma  extensiva  (orden  en  que  mueven 
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los  jugadores,  información  de  que  disponen,. . . ).  Sin  embargo,  para  los  denominados  juegos 
estáticos,  en  los  que  los  jugadores  eligen  una  sola  vez  y lo  hacen  de  manera  simultánea,  son 
muy  sencillas:  sólo  recogerán  un  movimiento  u acción  para  cada  jugador  ya  que  ninguno  de 
ellos  tendrá  información  alguna  sobre  las  decisiones  de  los  otros  cuando  le  toque  mover. 


► Ejercicio  1.2.1 

Represente  en  forma  normal  los  siguientes  juegos:  Papel,  piedra  o tijeras,  Pares  o nones  y el 
Dilema  del  prisionero. 


1.2.3  Relación  entre  la  forma  estratégica  y la  forma  extensiva 

El  concepto  de  estrategia  permite  pasar  cualquier  juego  en  forma  extensiva  a su  forma  estra- 
tégica. En  cambio,  dado  un  juego  en  forma  estratégica  no  siempre  existe  una  representación 
única  en  forma  extensiva.  En  cualquier  caso,  lo  natural  es  partir  de  la  forma  extensiva  (cons- 
tituye la  representación  más  detallada  de  la  situación  de  interdependencia  estratégica)  a la 
forma  normal. 


► Ejercicio  1.2.2 

Represente  en  forma  extensiva  el  juego  Papel,  piedra  o tijeras. 


► Ejercicio  1.2.3 

Dado  el  juego  en  forma  extensiva  que  aparece  en  la  figura  adjunta,  determine  el  conjunto 
de  estrategias  de  cada  uno  de  los  jugadores  y represéntelo  en  forma  normal. 


Prof.  Pedro  Álvarez  Caúselo 

Departamento  de  Economía  - Universidad  de  Cantabria 


16 


Apuntes  de  Teoría  de  Juegos  - Curso  2012-2013 
Material  publicado  bajo  licencia  Creative  Commons 


1 Introducción 


(2.5.2) 

(3.2.3) 

(1,4,6) 

(6,3,9) 

(7,5,2) 

(4.6.5) 

(9.8.6) 

(3.2.7) 


Prof.  Pedro  Álvarez  Caúselo 

Departamento  de  Economía  - Universidad  de  Cantabria 


17 


Apuntes  de  Teoría  de  Juegos  - Curso  2012-2013 
Material  publicado  bajo  licencia  Creative  Commons 


1.3.  De  las  preferencias  a la  elección:  las  funciones  de  pagos 


1.3  De  las  preferencias  a la  elección:  las  funciones  de  pagos 

Tanto  en  la  en  la  representación  en  forma  extensiva,  como  en  la  representación  en  forma  es- 
tratégica, cada  desarrollo  posible  del  juego  (cada  combinación  posible  de  estrategias)  lleva 
asociado  un  vector  de  pagos.  Hasta  el  momento  nos  hemos  limitado  a afirmar  que  dichos 
vectores  recogen  las  preferencias  de  los  jugadores  en  relación  a los  posibles  desarrollos  del 
juego,  sin  entrar  en  más  detalles.  Pasamos  a preguntarnos  ahora  qué  representan  exacta- 
mente esos  números  y en  qué  medida  es  posible  pasar  de  las  preferencias  de  un  jugador 
en  relación  a los  posibles  desarrollos  del  juego  a sus  preferencias  en  relación  a sus  estra- 
tegias disponibles  (el  objetivo  último  de  un  juego  no  cooperativo  es  la  caracterización  del 
comportamiento  de  los  jugadores  en  términos  de  la  selección  de  estrategias).  Dado  que  un 
tratamiento  general  y detallado  de  estas  cuestiones  sobrepasa  las  posibilidades  de  este  curso, 
hemos  optado  por  abordarlas  en  el  marco  de  un  modelo  sencillo  con  dos  únicos  jugadores, 
cada  uno  de  ellos  a su  vez  con  dos  únicas  estrategias  disponibles.  Pensamos  que  ese  marco 
es  suficiente  para  poner  de  manifiesto  la  relevancia  de  los  supuestos  sobre  las  preferencias 
y sobre  su  representación  a través  de  las  funciones  de  pagos  en  el  proceso  de  modelización 
de  cualquier  situación  de  interdependencia  estratégica. 

Un  ejemplo  sencillo 

En  la  Figura  1.6  aparece  representado  un  juego  2X2  (dos  jugadores,  cada  uno  de  ellos  con 
dos  estrategias  posibles).  Dados  los  conjuntos  de  estrategias  de  los  jugadores  S¡  = { a,b } y 
Su  = {a,]6},  las  posibles  combinaciones  de  estrategias  vendrán  dadas  por  el  producto  carte- 
siano de  los  mismos: 

S = x Su  = {aci,ap,bc¿,bp}. 

Cada  una  de  estas  combinaciones  de  estrategias  supone  un  desarrollo  distinto  del  juego. 
Denominaremos  D al  conjunto  de  todos  los  desarrollos  posibles  del  juego,  el  cual  tendrá,  por 
tanto,  tantos  elementos  como  combinaciones  posibles  de  estrategias:  D = {di, d2, <¿3,  ¿4}.  La 
correspondencia  entre  los  elementos  de  S y los  de  D queda  clara  a partir  de  la  Figura  1.6  . 


a 

b 


Figura  1.6.  Desarrollos  posibles  para  un  juego  2X2 


a p 


d\ 

d^ 

dj 

d¿i 
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Nuestro  objetivo  último  es  analizar  el  comportamiento  de  los  jugadores  en  términos  de  su 
decisión  sobre  la  estrategia  a escoger.  Consideremos,  por  ejemplo,  la  situación  del  jugador  I. 
Supongamos  que  nos  dicen  que  inicialmente  sólo  conocemos  sus  preferencias  en  términos 
de  la  ordenación  que  hace  de  los  cuatro  posibles  desarrollos  del  juego.  En  ese  caso,  al  igual 
que  hacíamos  en  la  teoría  del  consumidor,  podríamos  recoger  dichas  preferencias  mediante 
cualquier  función  itj(d)  que  asignase  números  que  reflejasen  dicha  ordenación.  De  hecho, 
cualquier  transformación  monótona  positiva  de  dicha  función  (cualquiera  que  ordene  de  la 
misma  manera  los  cuatro  desarrollos  posibles  del  juego)  también  nos  serviría  para  recoger 
esas  mismas  preferencias. 


oí  ¿S 

a 

b 


Figura  1.7.  Función  de  pagos  del  jugador  I 

¿Es  posible  determinar  que  estrategia  elegirá  I sólo  a partir  de  esta  información?  La  respues- 
ta es  que  sólo  bajo  determinadas  condiciones  que  podemos  agrupar  en  dos  grandes  grupos: 

Caso  1 Si  una  estrategia  lleva  a desarrollos  del  juego  más  preferidos  que  las  otras  estrategias 
con  independencia  de  la  estrategia  del  II.  A modo  de  ejemplo,  si  I prefiere  di  a y ¿2 
a ¿4,  su  elección  sería  la  estrategia  a. 

Caso  2 Si  el  jugador  I «estuviese  seguro»  de  la  decisión  del  II.  A modo  de  ejemplo,  si  I «esta 
seguro»  de  que  II  va  a jugar  a bastaría  con  saber  si  prefiere  di  o d3. 

Si  no  se  diesen  ninguna  de  estas  dos  condiciones,  conocer  la  ordenación  que  hace  I de  los 
desarrollos  posibles  del  juego  no  es  suficiente  para  determinar  que  estrategia  elegirá.  En 
efecto,  a la  hora  de  elegir  I sabe  que  cada  una  de  sus  estrategias  le  lleva  a un  resultado 
distinto  en  función  de  la  estrategia  que  elija  II: 

■ Si  elige  a el  juego  se  puede  desarrollar  conforme  a di,  si  II  elige  oí,  o a di,  si  II  elige  /3. 

■ Si  elige  b el  juego  se  puede  desarrollar  conforme  a d3,  si  II  elige  oí,  o a d^,  si  II  elige  /3. 

Dado  que  las  consecuencias  de  sus  decisiones  dependen  de  lo  que  haga  el  otro,  parece  razo- 
nable considerar  que  además  de  la  valoración  que  haga  de  los  posibles  desarrollos  del  juego, 
en  su  decisión  influirán  también  sus  expectativas  sobre  que  estrategia  elegirá  el  jugador  II. 
Supongamos,  sin  entrar  por  el  momento  en  su  justificación,  que  podemos  representar  de 
manera  general  dichas  expectativas  mediante  una  distribución  de  probabilidad  (una  fun- 
ción que  asigna  probabilidades  a cada  una  de  las  estrategias  del  jugador  II).  Al  tener  S¡i 


ui(di) 

ui(di) 

ui(d3 ) 

ui(d^) 
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únicamente  dos  elementos,  podemos  representar  dicha  distribución  de  probabilidad  me- 
diante un  vector  (p,  1 — p),  donde  convenimos  que  p recoge  la  probabilidad  que  I asigna 
a que  II  elija  cc  y,  por  tanto,  1 — p la  que  asigna  a que  elija  /i  Por  ser  una  distribución  de 
probabilidad  se  ha  de  cumplir  que  p £ [0, 1],  recogiendo  los  extremos  del  intervalo  el  caso 
en  que  I «esta  seguro»  de  cual  será  la  decisión  del  II. 

Una  vez  aceptamos  la  posibilidad  de  representar  en  términos  de  probabilidad  las  expecta- 
tivas del  jugador  I,  podemos  plantear  su  elección  entre  estrategias  como  una  elección  entre 
distribuciones  de  probabilidad  con  soporte  el  conjunto  de  desarrollos  posibles  del  juego  (ca- 
da estrategia  lleva  asociados  dos  desarrollos  posibles  del  juego,  a cada  uno  de  los  cuales  se 
le  asigna  una  determinada  probabilidad)  a las  que,  siguiendo  la  práctica  habitual,  vamos  a 
denominar  loterías: 

la  ; di,  ¿2,  P / 1 P) ' 

l b ; ^3,  dzj.,  p , 1 p ) . 

Lo  ideal  sería  poder  asignar  un  valor  numérico  a cada  lotería  Vi(l)  de  tal  forma  que  pudiése- 
mos plantear  el  problema  de  decisión  de  I en  términos  de  la  elección  de  la  estrategia  para  la 
que  Vj (/)  toma  un  valor  más  alto.  Como  pone  claramente  de  manifiesto  la  propia  naturaleza 
de  las  loterías,  el  valor  que  tome  V(l)  debería  tener  en  cuenta  dos  tipos  de  factores: 

1.  Las  preferencias  del  jugador  I en  relación  a los  desarrollos  posibles  del  juego  D. 

2.  Las  expectativas  del  jugador  I en  relación  a la  ocurrencia  de  cada  uno  de  esos  desarro- 
llos. 

¿Será  posible  encontrar  una  función  Vi{l)  que  desempeñe  ese  papel?  La  respuesta  a esta 
pregunta  nos  la  da  la  conocida  como  teoría  de  la  utilidad  esperada.  El  análisis  en  profundidad 
de  los  contenidos  y fundamentos  de  dicha  teoría  sobrepasa  los  objetivos  de  este  curso  y nos 
remitimos  al  tratamiento  de  la  misma  en  cursos  superiores.  A pesar  de  ello,  es  necesario  de- 
jar constancia  de  que  está  detrás  del  procedimiento  que  seguiremos  a la  hora  de  caracterizar 
la  toma  de  la  decisiones  por  parte  de  los  jugadores  en  nuestros  modelos.  A efectos  prácti- 
cos, dicha  teoría  sostiene  que  bajo  determinados  supuestos  en  relación  a las  preferencias  del 
jugador  i sobre  el  conjunto  de  loterías  que  constituye  su  conjunto  de  elección,  existirá  una 
función  que  vamos  denominar  w¿(d),  la  cual  asigna  un  valor  numérico  a cada  posible  desa- 
rrollo del  juego,  y tal  que  permite  plantear  el  problema  de  decisión  del  jugador  en  términos 
de  la  elección  de  la  estrategia  que  le  proporciona  un  mayor  pago  esperado6. 

6La  función  upd)  se  suele  conocer  como  función  de  utilidad  Bernoulli  en  reconocimiento  a Daniel  Ber- 
noulli.  Este  autor  fue  el  primero  en  proponer  su  uso  en  1738,  en  el  marco  del  problema  de  elección  conocido 
como  ¡a  paradoja  de  San  Petersburgo.  Detrás  de  la  propuesta  de  Bernuilli  está  la  idea  de  que  lo  relevante  para 
los  individuos  a la  hora  de  elegir  en  condiciones  de  incertidumbre  es  la  «utilidad»  de  las  posibles  pérdidas  y 
ganancias  y no  simplemente  el  valor  monetario  de  las  mismas. 
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Volviendo  a la  pregunta  concreta  que  nos  acabamos  de  plantear,  bajo  determinados  supues- 
tos sobre  las  preferencias  de  I en  relación  a las  loterías,  si  existe  esa  función  V¡(1)  y,  además, 
adoptará  la  siguiente  forma  para  cada  una  de  sus  estrategias: 

V(la)  = pui(di)  + (1  - p)ui(d2 ); 

V{lh)  = puj(d3)  + (1  - p)Mi(d4). 

En  este  caso,  por  tanto,  los  números  que  asignan  nuestras  funciones  de  pagos,  han  de  ser 
tales  que  nos  permitan  plantear  la  elección  de  un  jugador  entre  sus  estrategias  en  términos 
de  la  maximización  del  pago  esperado  (la  esperanza  matemática  de  los  pagos  a los  que 
puede  llevar  dicha  estrategia  de  acuerdo  con  las  expectativas  del  jugador). 

Resumiendo  lo  visto  hasta  ahora,  la  práctica  habitual  será  que,  tanto  en  la  representación  en 
forma  extensiva  como  en  la  representación  en  forma  estratégica,  a cada  desarrollo  posible 
del  juego  le  asignemos  un  vector  de  pagos,  siendo  el  conjunto  de  dichos  vectores  los  que  re- 
cogen las  preferencias  de  los  jugadores.  Sin  embargo,  los  números  que  asocian  las  funciones 
de  pagos  a los  desarrollos  posibles  del  juego  pueden  tener  una  naturaleza  muy  diferente 
de  unos  modelos  a otros.  En  algunos  casos  será  suficiente  con  conocer  la  ordenación  que 
hacen  los  jugadores  de  los  posibles  desarrollos  del  juego,  en  cuyo  caso  las  funciones  de  pa- 
gos tendrán  un  carácter  ordinal  y los  números  asociados  a cada  desarrollo  posible  del  juego 
debemos  interpretarlos  en  esos  términos.  En  otros,  sin  embargo,  conocer  la  ordenación  no 
será  suficiente  y supondremos  que  las  preferencias  de  los  jugadores  son  tales  que  podemos 
plantear  su  elección  en  términos  de  la  maximización  del  pago  esperado.  En  este  segundo 
caso  los  números  asignados  a cada  desarrollo  posible  del  juego  representan  «algo  más»  que 
la  mera  ordenación  de  dichos  desarrollos  de  acuerdo  con  las  preferencias  de  los  jugadores. 
Para  entender  que  significa  ese  algo  más,  resulta  útil  considerar  el  caso  en  el  que  cada  desa- 
rrollo posible  del  juego  lleva  asociada  una  valoración  en  términos  monetarios  por  parte  de 
cada  jugador,  algo  habitual  en  el  caso  de  las  aplicaciones  de  la  teoría  de  juegos  a la  economía. 


Pagos  en  unidades  monetarias  y teoría  de  la  utilidad  esperada 

Sin  dejar  aún  nuestro  ejemplo  de  referencia,  consideremos  la  posibilidad  de  lo  que  co- 
nocemos es  la  valoración  monetaria  que  hace  cada  jugador  de  cada  uno  de  los  posibles 
desarrollos  del  juego.  Pensemos,  por  ejemplo,  que  nuestros  jugadores  son  empresas  y 
que  conocemos  cuales  serán  los  beneficios  de  cada  empresa  en  función  de  la  estrategia 
que  elija  ella  y la  que  elija  su  rival.  Centrándonos  de  nuevo  en  el  problema  de  decisión 
del  jugador  I,  denominemos  i v(d)  a la  función  que  asigna  la  valoración  monetaria  que 
hace  el  jugador  de  cada  posible  desarrollo  del  juego  tal  y como  aparece  recogido  en  la 
Figura  1.8. 
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Di  j6 


wj(di) 

w7(d2) 

wj(d3) 

w/(d4)) 

Figura  1.8.  Función  de  pagos  en  unidades  monetarias 


Desde  luego  u>i(d)  ordena  las  preferencias  de  un  agente  racional  en  relación  con  los  po- 
sibles desarrollos  del  juego  (simplemente  con  que  supongamos  que  prefiere  ganar  más 
a ganar  menos).  Sin  embargo,  esta  información  no  es  suficiente  cuando  cada  estrategia 
no  lleva  asociada  un  pago  cierto  sino  una  lotería.  Consideremos,  a modo  de  ejemplo,  la 
situación  recogida  en  la  Figura  1.9  bajo  el  supuesto  de  que  los  pagos  vienen  dados  en 
euros. 


Di  j6 


a 


b 


Figura  1.9.  Pagos  en  unidades  monetarias:  un  ejemplo 


200 

300 

0 

600 

La  elección  de  una  de  sus  dos  estrategias  por  parte  del  jugador  I la  podemos  ver  como 
un  problema  de  elección  entre  las  siguientes  loterías: 

la  = (200,300;  p,  1 — p); 

h = (0, 600;  p,  1 - p). 

La  pregunta  que  nos  hacemos  es  si  podemos  establecer  como  criterio  de  decisión  que 
el  jugador  I elegirá  la  estrategia  con  una  mayor  ganancia  monetaria  esperada.  En  otras 
palabras,  ¿podemos  asociar  el  comportamiento  racional  de  un  jugador  en  condiciones 
de  incertidumbre  a la  maximización  de  la  ganancia  monetaria  esperada?  Para  llegar  a 
la  respuesta  de  esta  pregunta  puede  servirnos  de  ayuda  considerar  unas  expectativas 
concretas.  Supongamos,  por  ejemplo,  que  p = debido  a que  sabe  con  certeza  que  el  II 


Prof.  Pedro  Álvarez  Caúselo 

Departamento  de  Economía  - Universidad  de  Cantabria 


22 


Apuntes  de  Teoría  de  Juegos  - Curso  2012-2013 
Material  publicado  bajo  licencia  Creative  Commons 


1 Introducción 


decidirá  lanzando  una  moneda  no  trucada  al  aire.  En  este  caso  las  loterías  entre  las  que 
tiene  que  elegir  I serían: 


Dado  que  el  pago  esperado  de  Z&  es  de  300  €,  [E^(w)  = ^0  + ^600  = 300]  y la  de  la 
es  de  250  €,  [Ea(w)  = ^200  + j300  = 250]  la  pregunta  que  nos  estamos  planteando  es 
si  deberíamos  considerar  irracional  que  I eligiese  la  estrategia  a.  Suponga,  por  ejemplo 
que  a uno  de  sus  compañeros  de  clase  se  le  ofrece  participar  en  este  juego  y que  opta 
por  la  estrategia  a haciendo  el  siguiente  razonamiento:  «Es  cierto  que  b tiene  un  mayor 
ganancia  esperada,  pero  también  es  verdad  que  mientras  que  con  a me  garantizo  por  lo 
menos  200  €,  con  b hay  una  probabilidad  del  50%  de  que  no  gane  nada.»  Ciertamente 
lo  que  esta  planteando  su  compañero,  es  que  cuando  un  agente  tiene  que  decidir  en 
condiciones  de  incertidumbre  tiene  en  cuenta  algo  más  que  el  pago  esperado.  En  este 
caso  podríamos  decir  que  su  compañero  presenta  aversión  al  riesgo  e incluso  plantearnos 
la  medición  del  riesgo  presente  en  cada  una  de  las  loterías  a partir  de  la  varianza  de  cada 
una  ellas.  El  mayor  riesgo  que  presenta  la  lotería  b no  se  ve  compensado  por  la  mayor 
ganancia  esperada  y,  por  tanto,  el  jugador  elige  su  estrategia  a. 

De  nuevo  la  teoría  de  la  utilidad  esperada  viene  en  nuestro  auxilio:  bajo  determinados 
supuestos  sobre  las  preferencias  del  individuo  en  relación  a las  loterías,  existirá  una 
función  u(w)  tal  que  que  podemos  plantear  el  problema  de  decisión  de  un  agente  racio- 
nal en  términos  de  un  problema  de  maximización  de  la  utilidad  esperada.  En  nuestro 
ejemplo,  la  función  u(zv)  asignará  valores  a las  ganancias  monetarias  de  tal  forma  que 
podremos  determinar  la  estrategia  preferida  por  I comparando  el  valor  esperado  para 
cada  una  de  ellas: 


v(lb)  = \u(  0)  + ]ff(600). 


Se  dice  que  un  agente  económico  es  neutral  al  riesgo  cuando  ordena  las  distintas  lote- 
rías teniendo  en  cuenta  únicamente  la  ganancia  monetaria  esperada  de  cada  una  de  ellas. 
En  este  caso  no  habría  ningún  problema  en  que  los  números  que  aparecen  en  nuestros 
vectores  de  pagos  fuesen  directamente  las  ganancias  monetarias  de  cada  jugador.  Sin 
embargo,  las  preferencias  de  los  agentes  en  relación  a las  loterías  dependen  en  muchas 
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1.3.  De  las  preferencias  a la  elección:  las  funciones  de  pagos 


ocasiones,  no  sólo  de  la  ganancia  esperada,  sino  también  de  otros  factores  como  el  riesgo. 
En  este  caso,  los  números  que  aparecen  en  nuestros  vectores  de  pagos  deben  correspon- 
derse con  valores  de  una  función  u(w)  que  nos  permita  utilizar  el  criterio  de  la  utilidad 
esperada. 


A modo  de  conclusión 

El  objetivo  último  de  un  juego  no  cooperativo  es  analizar  el  comportamiento  de  los  jugado- 
res en  términos  de  la  elección  entre  sus  estrategias.  Aunque  en  muchas  ocasiones  tomaremos 
los  pagos  que  recogen  las  preferencias  de  los  jugadores  como  un  dato,  una  reflexión  sobre 
la  naturaleza  de  los  mismos  resulta  imprescindible  para  la  comprensión  de  cualquier  mo- 
delo. En  algunos  juegos  podremos  abordar  el  comportamiento  de  los  jugadores  partiendo 
únicamente  de  la  ordenación  que  éstos  hacen  de  los  posibles  desarrollos  del  juego.  En  este 
caso,  los  números  que  asigna  cada  función  de  pagos  contendrán  únicamente  información 
de  carácter  ordinal  sobre  las  preferencias  del  jugador  en  relación  con  los  posibles  desarro- 
llos del  juego.  Sin  embargo,  en  muchos  otros  juegos  cada  estrategia  de  un  jugador  no  irá 
asociada  con  un  único  desarrollo  del  juego,  por  lo  que  debemos  plantear  su  problema  de  de- 
cisión en  términos  de  la  elección  entre  loterías  (distribuciones  de  probabilidad  con  soporte 
los  posibles  desarrollos  del  juego).  En  este  caso,  debemos  distinguir  dos  grandes  grupos  de 
determinantes  de  su  elección: 

1.  sus  preferencias  en  relación  a los  distintos  desarrollos  posibles  del  juego; 

2.  sus  creencias  o expectativas  sobré  lo  que  harán  los  otros  jugadores. 

La  manera  habitual  de  proceder  en  este  segundo  caso  consiste  en  dar  los  siguientes  pasos: 

1.  suponer  que  las  expectativas  de  un  jugador  pueden  representarse  mediante  una  dis- 
tribución de  probabilidad; 

2.  suponer  que  sus  preferencias  en  relación  a las  loterías  asociadas  a cada  una  de  sus 
estrategias  son  tales  que  podemos  plantear  su  problema  de  decisión  en  términos  de  la 
maximización  del  pago  esperado  (bien  porque  es  neutral  al  riesgo  y los  pagos  vienen 
dados  en  unidades  monetarias,  bien  porque  los  pagos  vienen  dados  directamente  en 
valores  de  una  función  de  utilidad  tipo  Bernoulli). 
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1.4  Ejercicios 

► Ejercicio  1.4.1 

Intente  dar  respuesta  a cada  una  de  las  siguientes  preguntas  relacionadas  con  distintas 
situaciones  de  interdependencia  estratégica: 

1.  ¿Qué  razones  pueden  justificar  que  alguien  «queme  sus  naves»? 

2.  ? Cómo  afecta  a la  prima  que  cobran  las  compañías  de  seguro  la  franquicia  que 
asume  el  cliente?  ¿Por  qué? 

3.  ¿Por  qué  cuando  se  hace  una  oferta  en  la  que  se  dice  que  el  precio  es  bajo  suele  ir 
acompañada  de  una  explicación  (por  cierre,  reforma,. . . )? 

4.  ¿Dónde  esperarías  encontrar  un  menú  del  día  con  una  mejor  relación  calidad  pre- 
cio, en  un  bar  de  un  polígono  industrial  o una  estación  de  trenes  o autobuses?¿Por 
qué? 

5.  ¿Se  vota  siempre  la  alternativa  «más  preferida»? 


► Ejercicio  1.4.2 

Considere  la  misma  situación  del  Ejemplo  1.1.2  pero  con  cuatro  mujeres  y cuatro  hom- 
bres y las  preferencias  recogidas  en  la  tabla  adjunta.  Aaplique  el  algoritmo  de  «acepta- 
ción diferida»  de  Gale-Shapley  para  determinar  el  conjunto  de  emparejamientos  estables 
en  los  siguientes  casos: 

1.  cuando  son  los  hombres  los  que  proponen; 

2.  cuando  son  las  mujeres  las  que  proponen. 


A 

B 

C 

D 

Di 

1,3 

2,3 

3,2 

4,3 

P 

1,4 

4,1 

3,3 

2,2 

7 

2,2 

1,4 

3,4 

4,1 

5 

4,1 

2,2 

3,1 

1,4 

► Ejercicio  1.4.3 

Considere  el  modelo  de  localización  espacial  de  Hotelling  del  Ejemplo  1.1.1.  Suponga 
ahora  que  las  empresas  ya  están  localizadas  en  los  dos  extremos  de  la  ciudad  y que 
siguen  vendiendo  un  producto  homogéneo  que  requiere  un  transporte  especializado 
que  realizan  ellas  mismas.  Si  las  empresas  fijan  un  precio  en  destino;  transporte  incluido. 
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¿en  qué  parte  de  la  ciudad  será  mayor  la  competencia  entre  las  empresas?  ¿Cómo  cree 
que  variarán  los  precios  netos  (descontado  el  coste  del  tranporte)  a lo  largo  de  la  ciudad? 


► Ejercicio  1.4.4 

Dos  individuos,  I y II,  se  enfrentan  al  siguiente  juego.  Dada  una  baraja  de  40  cartas,  la 
mitad  de  las  cuales  son  rojas  y la  otra  mitad  negra,  a cada  uno  de  los  individuos  se  les 
da  una  carta  elegida  al  azar  pudiendo  cada  jugador  ver  únicamente  el  color  de  la  suya. 
El  individuo  I tiene  que  decidir  a continuación  entre  dos  opciones: 

1.  Cartas  arriba.  En  ese  caso  si  un  jugador  tiene  una  carta  de  color  rojo  y el  otro  una 
de  color  negro,  este  último  deberá  pagarla  10  € al  otro  (rojo  gana).  En  caso  de  que 
las  dos  sean  del  mismo  color  ninguno  paga  nada. 

2.  Hacer  un  envite  doblando  la  apuesta.  En  este  caso  II  tiene  a su  vez  dos  opciones: 

■ Aceptar  el  envite,  en  cuyo  caso  si  son  de  distinto  color  ganará  la  roja  reci- 
biendo el  jugador  correspondiente  20  € mientras  que  si  son  del  mismo  color 
ninguno  recibe  nada. 

■ No  aceptar  el  envite,  en  cuyo  caso  deberá  pagar  10  € a I. 


► Ejercicio  1.4.5 

Represente  en  forma  extensiva  todas  las  posibles  situaciones  informativas  que  se  pueden 
dar  en  un  juego  3X2(tres  jugadores  cada  uno  de  ellos  con  2 estrategias  posibles). 


► Ejercicio  1.4.6 

Un  determinado  mercado  es  abastecido  por  dos  únicas  empresas  en  las  siguientes  con- 
diciones de  demanda  y de  costes: 

D : p = 100  — X;  X = X\  + Xi 

C : CTj(xi)  = 2x¡,  i = 1,2. 

Suponga  que  cada  una  de  las  empresas  ha  de  decidir  la  cantidad  de  producto  que  saca 
al  mercado  y haga  un  esbozo  de  la  forma  extensiva  del  juego  para  los  siguientes  marcos 
estratégicos: 

1.  La  empresa  2 se  comporta  como  seguidora  en  el  sentido  de  que  espera  a conocer 
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cuanto  saca  al  mercado  la  1 (la  líder)  antes  de  decidir  cuanto  saca  ella. 

2.  Ambas  empresas  han  de  decidir  de  manera  simultánea  cuanto  sacan  al  mercado. 


► Ejercicio  1.4.7 

Haga  la  representación  en  forma  normal  del  juego  del  Ejemplo  1.2.1  y del  juego  del 
Ejemplo  1.2.2. 


► Ejercicio  1.4.8 

Haga  la  representación  en  forma  normal  de  los  modelos  de  oligopolio  de  Cournot  y 
Stackelberg. 


► Ejercicio  1.4.9 

Represente  el  dilema  del  prisionero  en  forma  extensiva. 


► Ejercicio  1.4.10  La  paradoja  de  San  Petersburgo 

Suponga  que  le  ofrecen  participar  en  el  siguiente  juego.  Se  lanza  una  moneda  al  aire 
hasta  que  salga  la  primera  cruz  asignándole  un  premio  de  2”  * 10  € , donde  n es  el 
número  de  la  tirada  donde  aparace  la  primera  cruz. 

1.  ¿Cuál  es  la  esperanza  matemática  o ganancia  esperada  de  participar  en  este  juego? 

2.  ¿Cuánto  estaría  dispuesto  a pagar  por  participar  en  este  juego? 


► Ejercicio  1.4.11 

Considere  el  juego  representado  en  la  Figura  1.10  y plantee  la  decisión  de  cada  uno  de 
los  jugadores  como  un  problema  de  elección  entre  loterías. 
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sin  S112 

511 

512 


20,7 

10,5 

-10,5 

40,9 

Figura  1.10 


► Ejercicio  1.4.12 

Se  lanza  una  moneda  al  aire,  si  sale  cara  se  le  pagan  100  €,  pero  si  sale  cruz  es  usted 
quien  tiene  que  pagar  80  €. 

1.  ¿Cual  es  la  esperanza  matemática  de  este  juego? 

2.  ¿Participaría  en  el  mismo  si  le  ofreciesen  esa  posibilidad? 

3.  Si  un  casino  ofreciese  la  participación  en  este  juego  tantas  veces  como  se  quiera, 
¿tendría  clientes  para  dicho  juego? 

4.  Valore  globalmente  la  respuesta  a los  apartados  anteriores 


► Ejercicio  1.4.13 

Considere  el  problema  de  elección  del  jugador  I recogido  en  la  figura  adjunta  y explique 
bajo  que  supuestos  podríamos  determinar  la  elección  de  dicho  jugador  a partir  del  pago 
esperado  para  cada  una  de  sus  estrategias. 
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Figura  1.11.  Decisión  con  incertidumbre. 
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2 Juegos  estáticos  (I) 


2.1  Introducción 


En  el  tema  anterior  hemos  visto  que  la  forma  de  trabajar  en  la  teoría  de  juegos  es  mediante  la 


elaboración  y manejo  de  un  tipo  especial  de  modelos  denominados  juegos.  Presentamos  la 
forma  normal  o estratégica  y la  forma  extensiva  como  alternativas  para  representar  un  juego 
no  cooperativo,  e hicimos  una  primera  aproximación  a la  naturaleza  de  la  las  funciones  de 
pagos  y su  papel  en  ese  proceso  de  modelización.  En  este  tema  vamos  a entrar  ya  en  el 
análisis  de  un  tipo  especial  de  situaciones  de  interdependencia  estratégica,  aquellas  en  las 
que  los  jugadores  tienen  que  decidir  de  manera  simultánea,  en  el  sentido  de  que  cada  uno 
de  ellos  a la  hora  de  elegir  entre  sus  estrategias  no  conocerá  la  elección  del  otro.  Los  modelos 
relacionados  con  este  tipo  de  situaciones  se  denominan  juegos  estáticos  o simultáneos.  Por 
oposición  a ellos,  en  los  denominados  juegos  dinámicos  al  menos  un  jugador  dispondrá 
de  información,  en  el  momento  de  decidir,  sobre  el  movimiento  o movimientos  previos  de 
otros  jugadores.  Nos  limitaremos,  por  el  momento,  a los  denominados  juegos  estáticos  con 
información  completa,  en  los  cuales  se  supone  que  la  estructura  del  juego  (las  reglas  y las 
funciones  de  ganancias)  es  conocimiento  común. 

► Ejercicio  2.1.1 

¿El  juego  de  los  chinos  es  estático  o dinámico?  ¿Bajo  que  condiciones  pasaría  a ser  estático? 

En  este  tipo  de  juegos  las  estrategias  de  los  jugadores  son  muy  sencillas  (constan  de  un  solo 
movimiento  o acción)  por  lo  que  resulta  natural  partir  directamente  de  la  representación 
en  forma  normal  o estratégica.  Como  vimos  en  el  tema  anterior,  dicha  forma  normal  queda 
caracterizada,  además  de  por  el  conjunto  de  jugadores,  por  los  espacios  de  estrategias  y las 
funciones  de  ganancias  de  cada  uno  de  ellos: 


(2.1) 


El  hecho  de  que  los  jugadores  se  enfrenten  una  sola  vez,  hace  que  al  tomar  sus  decisio- 


nes no  estén  pendientes  de  las  consecuencias  futuras  de  sus  acciones.  Al  decidir  de  forma 
simultánea,  la  preocupación  fundamental  de  cada  jugador  será  la  formación  de  unas  expecta- 
tivas correctas  sobre  el  comportamiento  del  resto  de  jugadores.  Como  ejemplos  de  este  tipo 
de  situaciones  podemos  considerar  las  subastas  de  sobre  cerrado,  determinados  sistema  de 
votación, . . . Hemos  de  tener  en  cuenta,  además,  que  las  herramientas  que  desarrollemos  en 
este  marco  nos  serán  útiles  cuando  consideremos  situaciones  estratégicas  más  ricas  (en  las 
que  si  se  considere  la  influencia  de  la  sombra  del  futuro,  no  exista  simultaneidad  en  la  toma 
de  decisiones,  la  información  sea  incompleta,. . . ). 
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2.1.  Introducción 


Una  vez  tenemos  representado  un  juego  en  su  forma  normal,  el  objetivo  del  modelo  es  tratar 
caracterizar  el  comportamiento  de  los  jugadores  en  términos  de  su  elección  entre  las  estra- 
tegias de  que  disponen1.  El  punto  de  partida  es  el  supuesto  de  que  se  comportan  de  manera 
racional,  esto  es,  eligen  entre  sus  estrategias  de  acuerdo  con  sus  objetivos  (recogidos  en  el 
modelo  a través  de  las  funciones  de  pagos)  y la  información  de  que  disponen  (por  ser  juegos 
de  información  completa  la  estructura  del  juego  es  conocimiento  común).  Comenzaremos 
viendo  que  en  algunos  casos  el  supuesto  de  racionalidad  es  suficiente  para  descartar  la  elec- 
ción por  parte  de  un  jugador  de  determinadas  estrategias:  aquellas  que  no  constituyan  la 
mejor  respuesta  bajo  ninguna  de  las  expectativas  posibles  que  se  pueda  formar  el  jugador  so- 
bre el  comportamiento  del  resto.  La  estrecha  interrelación  entre  la  elección  de  un  jugador  y 
sus  expectativas  sobre  lo  que  harán  el  resto  de  jugadores,  hace  que  sean  estás  el  centro  de 
atención  en  la  segunda  parte  del  tema.  Podríamos  decir  que  el  hilo  conductor  de  este  tema 
es  tratar  de  descubrir  qué  no  harán  y qué  no  creerán  los  jugadores  en  el  marco  de  un  juego  está- 
tico con  información  completa  cuando  la  racionalidad  de  cada  uno  de  ellos  es  conocimiento 
común. 


1Cuando,  de  acuerdo  con  algún  criterio,  se  propone  una  determinada  combinación  de  estrategias  como 
desarrollo  de  un  juego,  dicha  combinación  de  estrategias  se  conoce  como  solución  del  juego. 
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2.2  Estrategias  dominadas 

2.2.1  Jugadores  racionales  no  juegan  estrategias  dominadas 

En  el  intento  de  caracterizar  el  comportamiento  de  los  jugadores,  vamos  a comenzar  por 
preguntarnos  si  existen  algunas  estrategias  que  podamos  descartar  como  elecciones  posibles 
de  un  jugador  racional.  En  esta  aproximación  gradual  al  proceso  de  selección  de  estrategias, 
descartaremos  inicialmente  que  un  jugador  elija  una  determinada  estrategia  si  dispone  de 
otra  que  le  reporte  mayores  pagos  con  independencia  de  lo  que  hagan  los  otros  jugadores.  En 
términos  más  técnicos,  diremos  que  los  jugadores  racionales  no  elegirán  nunca  estrategias 
que  estén  estrictamente  dominadas. 


A 

M 

B 


L C D 


7,5 

3,4 

2,6 

8,7 

6,2 

5,1 

9,4 

1,2 

4,5 

Figura  2.1.  Un  juego  con  estrategias  dominadas 

En  el  juego  de  la  Figura  2.1  para  el  jugador  I la  estrategia  A esta  dominada  por  la  estrategia 
M y para  el  jugador  II  la  estrategia  C esta  dominada  por  la  estrategia  L.  Parece  lógico  pro- 
poner, por  tanto,  que  I nunca  jugará  A y que  II  nunca  jugará  C.  Reducimos,  por  tanto,  los 
desarrollos  del  juego  posibles  entre  jugadores  racionales  a los  cuatro  que  aparecen  recogidos 
en  la  Figura  2.2. 


L D 

M 

B 


8,7 

5,1 

9,4 

4,5 

Figura  2.2.  Versión  reducida  del  juego  de  la  Figura  2.1 

Definición  2.2.1  (Estrategia  estrictamente  dominada)  Dado  G = (/,  {Sí}^=1,{Uí}^=1),  la  es- 
trategia Sj  es  una  estrategia  (estrictamente)  dominada  para  el  jugador  i si  y sólo  si  existe  otra  estrategia 
ü • s_ j)  Uj ( , s _ ¿ , Vs_¿  <E  S — 
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2.2.2  Solución  por  dominancia  estricta:  el  dilema  del  prisionero 

La  eliminación  de  las  estrategias  dominadas  nos  llevará  normalmente  a un  juego  más  senci- 
llo, en  el  que  se  habrá  reducido  el  número  de  combinaciones  de  estrategias  que  son  candida- 
tas  a solución  del  mismo.  Cabe  pensar  en  un  caso  extremo  en  el  cuál  una  de  las  estrategias 
de  un  jugador  le  de  mejores  resultados  que  todas  las  demás  a su  alcance,  con  independencia 
de  lo  que  hagan  los  demás  jugadores.  En  este  caso  se  dice  que  el  jugador  tiene  una  estrategia 
(estrictamente)  dominante. 

Definición  2.2.2  (Estrategia  estrictamente  dominante)  DadoG  = {J,{Si}¡Lv{  Ui}?=1),  la  es- 
trategia si  es  unaestrategia  (estrictamente)  dominante  para  i si  y sólo  si: 

Ui(Si,S  — i)  íi¿(S¿,S_¿),  VS;  £ S¿,  Vs_;  £ Si. 

Si  cada  jugador  tiene  una  estrategia  que  le  da  mejores  resultados  que  las  otras,  hagan  lo  que 
hagan  el  resto  de  jugadores,  parece  poco  discutible  proponer  esa  combinación  de  estrate- 
gias como  solución  del  juego.  En  este  caso,  el  supuesto  de  racionalidad  de  los  jugadores  es 
suficiente  para  proponer  un  primer  concepto  de  solución. 

Definición  2.2.3  (Solución  por  dominancia)  Dado  un  juego  estático  en  forma  normal  G,  si  existe 
una  estrategia  estrictamente  dominante  s¿  para  cada  uno  de  los  jugadores,  la  combinación  de  estrate- 
gias s constituye  la  solución  por  dominancia  del  juego. 

La  solución  por  dominancia  ni  siquiera  requiere  que  los  jugadores  tengan  en  cuentan  las 
expectativas  sobre  lo  que  harán  los  otros,  algo  poco  frecuente  en  las  situaciones  de  interde- 
pendencia estratégica.  Sin  embargo,  en  este  marco,  tan  poco  estratégico,  nos  encontramos 
con  uno  de  los  modelos  más  conocidos  y relevantes  de  la  teoría  de  juegos:  el  dilema  del  pri- 
sionero. 

El  dilema  del  prisionero 

El  dilema  del  prisionero  constituye,  sin  duda,  el  modelo  más  conocido  de  la  teoría  de  juegos. 
El  problema  estratégico  que  representa  fue  analizado  por  primera  vez  en  1950  por  los  mate- 
máticos Merrill  Flood  y Melvin  Dresher,  en  el  ámbito  de  la  organización  RAND.  El  nombre 
y la  historia  asociada  al  mismo  fueron  inventados  por  el  también  matemático  Albert  Tucker, 
consejero  de  esa  misma  organización,  como  forma  de  hacer  el  modelo  más  accesible  a todo 
tipo  de  público.  La  historia  que  propuso  es  la  siguiente: 

Dos  individuos  son  detenidos  como  sospechosos  de  haber  cometido  un  delito 
grave.  No  existen  pruebas  suficientes  para  condenarlos,  pero  la  policía  intenta 
que  se  inculpen  mutuamente.  Para  ello,  tras  incomunicarlos  poniéndolos  en  cel- 
das separadas,  les  proponen  que  firmen  un  papel  involucrando  a su  compañero. 

Los  agentes  le  explican  a cada  preso  su  situación,  la  cual  viene  a ser  la  siguiente: 
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■ si  delata  a su  compañero  y el  otro  no  lo  delata  a él,  será  puesto  en  libertad, 
ya  que  no  habrá  pruebas  que  lo  involucren  y le  premiarán  por  colaboración 
con  la  justicia; 

■ si  delata  a su  compañero  y éste  también  lo  delata  a él,  ambos  serán  conde- 
nados por  el  delito  grave,  pero  verán  rebajada  su  condena  por  colaboración 
con  la  justicia; 

■ si  no  delata  a su  compañero,  pero  éste  sí  le  delata  a él,  le  caerá  la  pena  má- 
xima, sin  que  se  vea  reducida  por  colaboración  con  la  justicia; 

■ si  ninguno  de  los  dos  delata  al  otro,  no  habrá  pruebas  para  condenarlos  por 
el  delito  grave,  pero  si  les  podrán  condenar  por  otros  delitos  menores  para 
lo  que  si  disponen  de  pruebas. 

Cada  jugador  dispone,  por  tanto,  de  dos  estrategias  posibles,  delatar  (D)  o no  delatar  (D),  y 
sus  preferencias  sobre  los  desarrollos  posibles  del  juego  son  de  la  forma: 

(Di,  Dj)  y j ( Di,D¡ ) y i ( D¡,Dj ) y¡ 

Para  unos  valores  concretos  de  las  funciones  de  pagos  que  mantengan  esta  ordenación  de  los 
desarrollos  posibles  del  juego  , podemos  representar  dicha  situación  mediante  la  siguiente 
matriz: 


D D 

D 

D 

Figura  2.3.  Una  posible  matriz  de  pagos  para  el  dilema  del  prisionero 


8,8 

0,10 

10,0 

2,2 

¿Qué  estrategia  cabe  esperar  que  adopten  los  jugadores  en  esta  situación?  Sea  cual  sea  la 
expectativa  de  cada  uno  de  ellos  sobre  el  comportamiento  del  otro,  la  mejor  alternativa  que 
tiene  es  D 2.  La  paradoja  «social»  radica  en  que  cuando  cada  uno  de  ellos  elige,  racional- 
mente, su  estrategia  dominante  D,  ambos  acaban  en  una  situación  peor  que  si  eligiesen  su 
estrategia  dominada  D.  La  situación  de  fondo  asociada  a las  situaciones  tipo  dilema  del  pri- 
sionero refleja  la  existencia  de  ventajas  derivadas  de  la  cooperación  mutua,  si  bien  cada  uno 
de  los  agentes  tiene  un  incentivo  a desviarse  (a  no  asumir  el  coste  de  la  cooperación).  Debido 

2Bajo  los  supuestos  de  información  completa  y conocimiento  común  de  la  racionalidad,  la  expectativa 
sobre  el  comportamiento  del  rival  debería  ser  que  también  elegirá  D. 
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a ello,  también  es  habitual  presentar  la  elección  de  los  jugadores  en  términos  de  «cooperar» 
o «no  cooperar»,  algo  que  haremos  habitualmente  a lo  largo  del  curso. 


► Ejercicio  2.2.1 

Haga  una  representación  de  una  situación  tipo  dilema  del  prisionero  cambiando  el  nombre 
de  las  estrategias  de  los  jugadores  a C (cooperar)  y C (no  cooperar)  y con  unas  funciones 
de  pagos  distintas.  Explique  a continuación  que  condición  han  de  cumplir  los  pagos 
para  que  estemos  ante  una  situación  tipo  dilema  del  prisionero. 


La  trascendencia  de  esta  situación  estratégica  se  deriva  de  que  se  observa  con  mucha  fre- 
cuencia en  distintos  ámbitos  de  la  realidad  social  (carrera  de  armamentos,  relaciones  comer- 
ciales entre  países,  política  fiscal  de  las  CCAA,  acuerdos  colusivos  entre  empresas, . . . ). 

Es  importante  darse  cuenta  de  que  los  propios  jugadores  tienen  incentivos  para  crear  meca- 
nismos e instituciones  que  cambien  la  estructura  del  juego  (las  reglas  o incluso  las  funciones 
de  ganancias  ) de  forma  que  se  alcance  la  cooperación  entre  las  partes  3.  Sin  embargo,  con- 
trariamente a lo  que  ocurre  desde  el  punto  de  vista  de  las  partes  implicadas,  los  resultados 
derivados  de  una  situación  tipo  dilema  del  prisionero  no  tienen  porque  ser  «malos»  desde 
el  punto  de  vista  de  terceras  partes  (el  hecho  de  que  las  empresas  no  lleguen  a acuerdos 
colusivos  conduce  a un  mayor  bienestar  social,  una  empresa  puede  inducir  una  mayor  pro- 
ductividad entre  sus  trabajadores  haciendo  que  se  enfrenten  a situaciones  de  este  tipo  . . . ). 
En  consecuencia,  esas  terceras  partes  tendrán  incentivos  para  diseñar  mecanismos  e institu- 
ciones que  las  provoquen  (la  política  de  defensa  de  la  competencia,  el  diseño  de  un  torneo 
entre  sus  trabajadores  por  parte  de  una  empresa, . . . ). 


Ejemplo  2.2.1  ¿ A setas:  hoy  o mañana? 

Las  recientes  lluvias  han  hecho  que  la  primeras  setas  aparezcan  en  el  bosque.  Aunque 
cada  uno  de  los  «seteros»  de  una  pequeña  localidad  sabe  que  lo  ideal  sería  esperar  un 
día  más  para  que  se  desarrollasen  plenamente,  cada  uno  de  ellos  está  con  la  cesta  pre- 
parada al  amanecer.  Vamos  a representar  esta  situación  de  interdependencia  estratégica 
mediante  un  juego.  Supongamos  inicialmente  que  sólo  hay  dos  jugadores,  que  las  setas 
disponibles  tienen  un  determinado  valor,  y que  éste  será  mayor  si  esperan  a mañana 
que  si  las  recogen  hoy.  Suponemos  también  que  cada  jugador  tiene  que  decidir  si  va  hoy 
o si  espera  a mañana,  sabiendo  que  si  van  los  dos  el  mismo  día  cada  uno  se  llevará  la 


3 Los  cambios  en  las  reglas  pueden  lograrse  haciendo  que  el  futuro  sea  importante  (una  probabilidad  alta 
de  volverse  a encontrar  en  la  misma  situación  puede  hacer  que  la  estrategia  óptima  pase  por  cooperar  en 

el  presente),  haciendo  que  sean  posibles  los  acuerdos  vinculantes  recurriendo  a una  tercera  parte, Los 

«pagos»  de  los  jugadores  pueden  verse  influidos  incluso  por  los  principios  éticos  o los  valores  religiosos  de  las 
distintas  sociedades.) 
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mitad,  mientras  que  si  va  uno  sólo  se  las  lleva  él  todas.  Bajo  estos  supuestos,  podemos 
representar  esta  situación  de  interdependencia  estratégica  mediante  la  siguiente  matriz: 


H M 

H 

M 

Figura  2.4.  A setas,  ¿hoy  o mañana? 


10,10 

20,0 

0,20 

15,15 

Dado  que  la  estrategia  H es  una  estrategia  dominante  para  cada  uno  de  los  jugadores, 
(H,  H ) constituye  la  solución  del  juego  por  dominancia  estricta.  Haga  lo  que  haga  el  otro 
jugador,  cada  uno  de  ellos  obtendrá  un  mejor  resultado  si  va  hoy  que  si  decide  esperar 
a mañana,  por  lo  que  cabe  esperar  que  ambos  decidan  ir  hoy,  sin  ni  siquiera  pararse  a 
pensar  que  hará  el  otro.  Sin  embargo,  resulta  inmediato  darse  cuenta  de  que  si  ambos 
jugadores  se  pusiesen  de  acuerdo  y decidiesen  aplazar  un  día  más  la  recolección,  los  dos 
acabarían  mejor. 

Incluso  un  modelo  tan  sencillo  como  éste  nos  permite  poner  de  manifiesto  un  resulta- 
do enormemente  trascendente:  en  determinadas  situaciones  de  interdependencia  estratégica, 
si  los  jugadores  se  guían  por  sus  intereses  individuales,  todos  acaban  peor  que  si  tuviesen  en 
cuenta  el  interés  colectivo.  Si  se  pusiesen  de  acuerdo  y eligiesen  cada  uno  de  ellos  su  estra- 
tegia dominada,  los  dos  acabarían  mejor  que  si  eligen  guiados  únicamente  por  el  interés 
individual. 

¿Nos  ayuda  el  modelo  a explicar  lo  que  ocurre  en  alguna  situación  real  de  interdepen- 
dencia estratégica?  ¿No  parece  razonable  que  los  jugadores  se  pongan  de  acuerdo  y 
elijan  M?  La  respuesta  a estas  preguntas  requiere  tener  presente  que  nuestro  análisis  se 
lleva  a cabo  en  el  marco  de  un  modelo  con  unos  supuestos  concretos.  En  particular  nues- 
tras reglas  del  juego  establecen  que  los  jugadores  se  «enfrentan»  a esa  decisión  una  sola 
vez  y que  ésto  es  conocimiento  común.  Lo  que  nos  dice  el  modelo  es  que  si  dos  indivi- 
duos que  no  se  conocen  y saben  con  certeza  que  no  se  van  a ver  en  el  futuro  tienen  que 
decidir,  el  interés  individual  les  llevará  a coger  la  cesta  inmediatamente.  Si  la  situación 
del  mundo  real  que  pretendemos  analizar  no  es  esta  (los  individuos  pueden  ponerse  de 
acuerdo  de  forma  creíble,  el  Ayuntamiento  puede  fijar  periodos  de  recolección,. . . ) de- 
bemos esperar  un  poco  más  para  utilizar  modelos  más  complejos  que  permitan  recoger 
situaciones  de  interdependencia  estratégica  más  ricas.  Evidentemente,  existe  esa  fuer- 
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za  que  induce  al  acuerdo  entre  los  jugadores,  pero  ésta  no  resulta  sencilla  de  canalizar: 
¿bastará  con  que  hablen  entre  ellos?;  ¿tendrán  que  vigilarse  el  uno  al  otro  durante  todo  el 
día?;  ¿será  necesario  (y  posible)  que  firmen  un  contrato  y los  vigile  un  tercero?;  ¿bastará 
con  que  el  Ayuntamiento  utilice  su  autoridad  y fije  cuando  se  puede  ir?; . . . Quizás  poner 
en  práctica  cualquiera  de  estas  alternativas  tenga  un  coste  demasiado  alto  en  relación  a 
las  ganancias  derivadas  de  conseguir  retrasar  un  día  más  la  recolección. 

En  resumen,  el  modelo  nos  permite  sacar  una  doble  conclusión: 

1.  En  determinados  marcos  estratégicos  la  elección  racional  por  parte  de  los  jugado- 
res lleva  a situaciones  que  no  son  óptimos  paretianos  (todos  podrían  mejorar  si  se 
coordinasen  y eligiesen  una  estrategia  que  no  es  óptima  desde  el  punto  de  vista 
individual). 

2.  El  hecho  de  que  la  situación  de  equilibrio  no  sea  un  óptimo  paretiano  hace  que  las 
propias  partes  tengan  interés  en  cambiar  las  reglas  del  juego,  pero  dicho  cambio 
puede  ser  costoso  o imposible. 


► Ejercicio  2.2.2 

el  problema  del  free  rider 

Se  conoce  como  problema  del  free  rider  o problema  del  polizón,  una  situación  en  la  cuál  los 
individuos  tienen  una  tentación  individual  a aprovecharse  de  la  aportación  de  otros  para 
sufragar  el  coste  de  bienes  colectivos  de  cuyo  disfrute  no  pueden  ser  excluidos  (bienes 
públicos).  En  este  ejercicio  se  propone  un  modelo  sencillo  que  reproduce  dicha  situación. 

Cuatro  individuos  disponen  de  100  € cada  uno  de  ellos,  teniendo  que  decidir  que  can- 
tidad asignar  a un  fondo  privado  y que  cantidad  a un  fondo  público.  Las  asignaciones 
a este  último  son  anónimas  y el  total  asignado  se  multiplicará  por  cuatro,  dividiéndose 
a continuación  a partes  iguales  entre  todos  los  individuos.  En  cuanto  al  fondo  privado, 
por  cada  euro  que  asigne  su  dueño  recibirá  dos  euros.  Se  pide: 

1.  Haga  la  representación  en  forma  normal. 

2.  Determine  la  solución  por  dominancia  estricta  de  este  juego. 

3.  Determine  la  combinación  de  estrategias  Pareto  óptima. 

4.  Proponga  algún  ejemplo  de  situaciones  en  las  que  se  dé  y sugiera  posibles  solucio- 
nes. 
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2.3  Estrategias  mejor  respuesta 


Ya  hemos  dado  un  primer  paso  hacia  la  caracterización  del  comportamiento  racional  en 
una  situación  de  interdependencia  estratégica:  jugadores  racionales  no  elegirán  nunca  es- 
trategias dominadas.  Pasamos  ahora  a considerar  el  proceso  de  selección  por  parte  de  un 
jugador  entre  sus  estrategias  no  dominadas.  Dado  que  los  resultados  asociados  a la  elección 
de  una  estrategia  no  dominada  dependerán  de  lo  que  hagan  los  otros  jugadores,  la  elección 
de  un  jugador  dependerá  de  las  expectativas  que  se  forme  sobre  las  estrategias  que  elegirán 
los  otros  jugadores. 


Comenzamos  esta  pregunta  proponiendo  una  forma  de  incorporar  las  expectativas  en  nues- 
tros modelos.  Veremos  a continuación  que,  una  vez  incorporamos  las  expectativas,  podemos 
ir  un  poco  más  allá  de  la  eliminación  de  estrategias  dominadas  a la  hora  de  caracterizar  el 
comportamiento  de  jugadores  racionales.  En  concreto,  descartaremos  que  los  jugadores  eli- 
jan una  determinada  estrategia  si  ésta  no  es  mejor  respuesta  bajo  algún  tipo  de  expectativas 
que  se  puedan  formar.  En  otras  palabras,  descartaremos  que  jugadores  racionales  jueguen 
una  determinada  estrategia  si  disponen  de  otra  que  les  da  mejores  resultados  crean  lo  que 
crean  acerca  de  las  estrategias  que  elegirán  el  resto  de  jugadores.  Aunque  ciertamente  una 
estrategia  dominada  no  será  nunca  mejor  respuesta,  veremos  que  puede  haber  estrategias 
que,  pese  a no  estar  dominadas,  no  serían  mejor  respuesta  bajo  ninguna  de  las  expectativas 
posibles. 


2.3.1  Representación  de  las  expectativas  mediante  distribuciones  de  probabilidad 


Consideremos  inicialmente  el  caso  sencillo  de  un  juego  con  dos  jugadores  como  el  que  apa- 
rece recogido  en  la  Figura  2.5.  Dado  que  el  jugador  II  sólo  tiene  dos  estrategias,  podemos 
recoger  las  expectativas  del  I sobre  su  comportamiento  mediante  un  vector  (p,  1 — p),  donde 
convenimos  que  p es  la  probabilidad  que  asigna  I a que  II  elija  Sui  (por  tanto,  se  cumplirá 
que  p £ [0, 1]).  El  caso  en  que  I estuviese  seguro  de  la  elección  del  II  se  correspondería  con 
una  distribución  de  probabilidad  degenerada,  en  la  que  toda  la  probabilidad  se  concentraría 
en  la  estrategia  pura  correspondiente.  De  manera  similar  podríamos  recoger  las  expectativas 
del  jugador  II  mediante  un  vector  (q,  r,  1 — q — r),  cuyos  componentes  serán  números  reales 
no  negativos  con  suma  la  unidad. 
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sin  sn2 


Sil 


S 12 


Sl3 


10,2 

0,4 

0,1 

10,3 

4,8 

4,0 

Figura  2.5.  Mejor  respuesta  frente  a dominancia  estricta 


Para  un  juego  con  dos  únicos  jugadores  y espacios  de  estrategias  finitos4  utilizaremos  la 
notación  para  recoger  unas  determinadas  expectativas  de  i respecto  a la  elección  del  j, 
siendo  }i¡  una  función  de  la  forma: 


}* li  '■  Sj  — > [0, 1] 
Sj  l ^ } li(Sj ). 


(2.2) 


En  tanto  que  distribución  de  probabilidad,  dicha  función  deberá  cumplir  que  Es^¿(sy)  = 1. 


En  los  juegos  con  más  de  dos  jugadores,  cada  uno  de  ellos  ha  de  formarse  expectativas  sobre 
la  estrategia  que  elegirá  cada  uno  de  los  otros.  En  este  caso,  sus  expectativas  serán  sobre  las 
combinaciones  de  estrategias  del  resto  de  jugadores.  A modo  de  ejemplo,  consideremos  el 
juego  representado  en  la  Figura  2.6,  en  el  cual  aparecen  en  filas  las  estrategias  del  jugador  I, 
en  columnas  las  del  jugador  II,  correspondiendo  al  jugador  III  la  elección  de  entre  la  matriz 
A y la  B.  En  dicho  juego  cada  uno  de  los  jugadores  ha  de  formarse  expectativas  sobre  las 
posibles  combinaciones  de  estrategias  de  los  otros  dos.  Por  ejemplo,  en  el  caso  del  jugador 
I sus  expectativas  vendrán  dadas  por  una  distribución  de  probabilidad  sobre  el  conjunto 
S— 7 = {oíA,  oíB,  /3A,  /3B}. 

a b ah 


l X 

10,0 

0,10 

l X 

10,0 

0,10 

P 

0,10 

10,0 

p 

0,10 

10,0 

A B 


Figura  2.6.  Un  juego  3X2 


4Aunque  lo  dejamos  fuera  de  nuestro  análisis  por  el  momento,  si  el  conjunto  de  estrategias  del  resto  de 
jugadores  fuese  continuo  podríamos  considerarlo  una  variable  aleatoria  y recoger  las  expectativas  del  jugador 

i a través  de  una  función  de  distribución. 
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Con  carácter  general,  vamos  a denotar  por  S_¿  al  conjunto  de  combinaciones  posibles  de  es- 
trategias de  todos  los  jugadores  menos  el  i y por  s_¿  a una  cualquiera  de  esas  combinaciones 
«reducidas»  de  estrategias.  Las  expectativas  del  jugador  i vendrán  dadas  por  una  distribu- 
ción de  probabilidad  sobre  S_¿.  Nos  referiremos  a una  de  esas  distribuciones  de  probabilidad 
(a  unas  expectativas  concretas)  mediante  la  expresión  y¿(s _¿)  y al  conjunto  de  distribuciones 
posibles  mediante5  A (S_¿).  Podemos  interpretar  y¿(s_¡)  como  una  función  que  asigna  una 
probabilidad  a cada  una  de  las  combinaciones  de  estrategias  reducidas  de  un  jugador: 


Pi  : S-i  — > [0,1] 
s-i  l— t 


(2.3) 


Por  ser  una  distribución  de  probabilidad  dicha  función  deberá  cumplir  que  y¿(s_¿)  > 0Vs_,  G S 
y que  Es_.y¿(s_¿)  = 1. 


Definición  2.3.1  (Expectativas  de  un  jugador)  Las  expectativas  del  jugador  i sobre  el  comporta- 
miento del  resto  de  jugadores  vienen  dadas  por  una  distribución  de  probabilidad  que  representamos 
mediante  una  función  p¡{s -i)  G A(S_¡)  que  cumplirá  y¡(s_¿)  > 0Vs_¿  G S_¿yíjweEs  s_¿)  = 1. 


► Ejercicio  2.3.1 

Considere  un  juego  con  cuatro  jugadores,  cada  uno  de  ellos  con  dos  estrategias,  y expli- 
que como  sería  la  función  p¡( s_i)  para  cada  uno  de  ellos. 


2.3.2  Expectativas  y elección  racional 

Consideremos  un  jugador  i con  unas  expectativas  dadas  y;(s_¿)  sobre  el  comportamiento 
del  resto  de  jugadores.  Dejando  para  más  adelante  el  análisis  del  proceso  de  formación  de 
esas  expectativas,  nos  centramos  en  cómo  elegiría  entre  sus  estrategias.  Su  incertidumbre 
sobre  lo  que  harán  los  otros  hace  que  cada  una  de  sus  estrategias  no  lleve  asociado  un  único 
desarrollo  del  juego,  sino  distintos  desarrollos  posibles,  cada  uno  de  ellos  con  una  probabi- 
lidad asociada  (la  que  asigna  en  sus  expectativas  a las  combinaciones  de  estrategias  de  los 
otros  que  llevan,  dada  la  suya,  a ese  desarrollo  del  juego).  La  elección  entre  sus  estrategias  la 
hemos  de  plantear,  por  tanto,  como  una  elección  entre  loterías,  entiendo  por  tal  un  conjunto 
de  pagos  o ganancias  posibles,  cada  una  de  ellos  con  una  determinada  probabilidad  asocia- 
da. A modo  de  ejemplo,  en  el  juego  de  la  Figura  2.2,  bajo  unas  determinadas  expectativas 
para  el  jugador  I dadas  por  el  vector  (p,  1 — p),  su  elección  entre  las  estrategias  M y B la 

5 Dad  o un  conjunto  finito  cualquiera  A,  en  matemáticas  es  habitual  recoger  por  A(  A ) el  conjunto  de  distri- 
buciones de  probabilidad  sobre  dicho  conjunto. 
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hemos  de  plantear  como  una  elección  entre  las  siguientes  loterías: 

lM  = (8,5;  p,l  — p); 
h = (9,4;  p,  1 — p). 

Como  ya  explicamos  anteriormente,  en  estos  casos  supondremos  que  el  jugador  elige  aque- 
lla estrategia  que  la  da  una  mayor  ganancia  esperada6.  A modo  de  ejemplo,  si  el  jugador  I 
tiene  unas  expectativas  dadas  por  (|,  |),  elegirá  su  estrategia  M ya  que  V(Im ) = ^ > ^ = 
V(¡b). 


► Ejercicio  2.3.2 

Determine  el  conjunto  de  expectativas  bajo  las  cuales  el  jugador  I elegiría  su  estrategia 
B. 


A partir  de  ahora  asociaremos,  por  tanto,  el  comportamiento  racional  de  los  jugadores  con 
la  elección  de  estrategias  que  sean  mejor  respuesta  a sus  expectativas,  en  el  sentido  de  que  no 
exista  ninguna  otra  estrategia  a su  alcance  que  tenga  un  mayor  pago  esperado  (si  puede  ha- 
ber otras  que  tengan  el  mismo  pago  esperado,  esto  es,  la  mejor  respuesta  a unas  expectativas 
dadas  no  tiene  porque  ser  única). 

Definición  2.3.2  (Estrategia  mejor  respuesta)  Dado  G = (/,  {lí/}^)  y dadas  unas 

expectativas  del  jugador  i,  p,(s_¡),  la  estrategia  s¿  es  mejor  respuesta  a dichas  expectativas  sí  y solo 
sí  Vi  (s¿;  p¿(s_¿))  > Vi  (s¡;  p;(s_¿))  Vs¿  e S¿. 

Si  alguna  de  las  estrategias  de  S,  no  constituye  mejor  respuesta  bajo  ninguna  de  las  expec- 
tativas posibles,  podemos  descartar  que  sea  elegida  por  un  jugador  racional  (por  definición 
tiene  otra  que  le  da  un  mayor  pago  esperado).  En  otras  palabras,  jugadores  racionales  no 
elegirán  nunca  aquellas  estrategias  para  las  que  existe  una  estrategia  mejor  sean  cuales  sean 
sus  expectativas  sobre  el  comportamiento  del  resto.  Es  muy  importante  tener  en  cuenta  que 
con  este  criterio  de  selección  no  estamos  limitando  en  modo  alguno  el  tipo  de  expectativas 
que  se  puede  formar  un  jugador  racional  (salvo  por  el  hecho  de  que  deben  ser  tales  que  se 
pueden  recoger  a través  de  una  distribución  de  probabilidad). 

Una  estrategia  dominada  no  puede  ser,  por  su  propia  definición,  mejor  respuesta  sean  cuales 
sean  las  expectativas  del  jugador.  La  pregunta  importante,  sin  embargo,  es  si  pueden  existir 

6Recordemos  que  si  los  pagos  vienen  dados  en  unidades  monetarias  estaríamos  asumiendo  agentes  neutra- 
les al  riesgo.  Un  planteamiento  más  general,  que  incorporase  el  análisis  del  efecto  del  riesgo  sobre  el  comporta- 
miento de  los  agentes,  requeriría  que  los  pagos  viniesen  dados  de  tal  forma  que  ya  recogiesen  las  preferencias 
de  los  individuos  en  relación  a las  loterías.  En  este  segundo  caso,  estaríamos  suponiendo  que  los  pagos  vienen 
dados  en  valores  de  función  de  utilidad  cardinal  y que  los  jugadores  eligen  buscando  maximizar  su  utilidad 
esperada. 
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estrategias  que,  sin  estar  dominadas,  no  constituyan  mejor  respuesta  bajo  ninguna  de  las  po- 
sibles expectativas  del  jugador.  Sólo  en  este  caso  estaríamos  avanzando  en  la  caracterización 
del  comportamiento  racional.  Para  tratar  de  responder  a la  misma,  consideremos  el  juego  de 
la  Figura  2.5.  Si  nos  ponemos  en  lugar  del  jugador  I vemos  que  ninguna  de  sus  tres  estrate- 
gias esta  dominada.  Queremos  determinar  ahora  si  existen  expectativas  (distribuciones  de 
probabilidad  de  la  forma  (p,  1 — p)  sobre  S//)  que  sostengan  a cada  una  de  ellas  como  mejor 
respuesta.  A primera  vista  apreciamos  que  Su  sería  la  mejor  respuesta  cuando  el  jugador  I 
estuviese  seguro  de  que  el  II  va  a jugar  s¡n  ( p = 1)  y,  de  la  misma  manera,  s¡2  sería  la  mejor 
respuesta  cuando  estuviese  seguro  de  que  el  II  va  a jugar  si¡2  ( p = 0).  Por  tanto,  la  duda  que 
nos  queda  es  si  existirá  algún  valor  de  p que  haga  que  sea  S73  la  estrategia  con  una  mayor 
pago  esperado,  esto  es,  que  sea  mejor  respuesta  para  I.  Para  un  valor  cualquiera  de  p,  el 
pago  esperado  del  jugador  I asociada  a cada  una  de  sus  estrategias  sería: 

Vi(sn;p ) = lOp 
Ví(sí2;p)  = l0(l-p) 

Vi(sI3;p)  = 4. 


En  la  Figura  2.7  aparecen  recogidos  los  valores  que  toman  estas  tres  funciones  para  todos  los 
posibles  valores  de  p.  Como  puede  apreciarse  en  la  misma,  no  existe  ningún  valor  de  p que 
haga  que  s¡3  sea  una  mejor  respuesta  para  el  jugador  I.  Si  cree  más  probable  Sui  (p  > -5), 
su  mejor  respuesta  es  sn;  si  cree  más  probable  Sm  (p  < -5),  su  mejor  respuesta  es  sm  y si 
asigna  la  misma  probabilidad  a ambas  (p  = .5),  son  mejores  respuestas  tanto  Su  como  Sm 

► Ejercicio  2.3.3 

Determine  el  conjunto  de  estrategias  que  pueden  ser  mejores  respuestas  bajo  algunas  de 
las  expectativas  posibles  para  cada  uno  de  los  jugadores  en  el  siguiente  juego: 


sm  su2 


Sil 

Sil 

S/3 


10,2 

0,4 

0,1 

10,3 

6,8 

6,0 

Figura  2.8 
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Figura  2.7.  Pago  esperado  de  las  estrategias  puras  del  jugador  I en  función  de  sus 
expectativas  sobre  el  comportamiento  del  II. 

El  ejemplo  anterior  pone  de  manifiesto  que  caracterizar  el  comportamiento  racional  en  tér- 
minos de  la  no  elección  de  estrategias  que  no  sean  mejor  respuesta  bajo  ninguna  de  las 
expectativas  posibles,  va  más  allá  de  hacerlo  en  términos  de  la  no  elección  de  estrategias 
estrictamente  dominadas.  En  la  práctica  lo  habitual  será  comenzar  eliminando  primero  las 
estrategias  de  un  jugador  que  estén  estrictamente  dominadas,  pasando  luego  a considerar 
si  existe  alguna  otra  estrategia  que  no  sea  mejor  respuesta  bajo  ninguna  de  las  expectativas 
posibles7. 

A modo  de  resumen,  los  resultados  alcanzados  hasta  el  momento  en  relación  con  el  com- 
portamiento de  jugadores  racionales  en  situaciones  de  interdependencia  estratégica  pueden 
resumirse  en  las  siguientes  dos  proposiciones: 

1.  no  elegirán  nunca  estrategias  que  no  sean  mejor  respuesta  bajo  algunas  de  sus  expecta- 
tivas posibles; 

2.  una  estrategia  estrictamente  dominada  nunca  será  mejor  respuesta,  pero  la  afirmación 
contraria  no  es  cierta. 


7Plantearemos  en  términos  más  generales  la  relación  entre  dominancia  y mejor  respuesta  en  el  Tema  4,  una 
vez  que  hayamos  ampliado  el  concepto  de  estrategia  para  incluir  las  denominadas  estrategias  mixtas. 
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2.4  Dominancia  iterada  y estrategias  racionalizables 

2.4.1  Introducción 

Hasta  el  momento  nuestra  caracterización  del  comportamiento  de  jugadores  racionales  se 
reduce  a la  afirmación  de  que  nunca  jugarán  estrategias  que  no  sean  mejores  respuestas  bajo 
alguna  de  las  expectativas  posibles.  Sin  embargo,  la  esencia  del  comportamiento  estratégico 
se  encuentra  precisamente  en  el  proceso  de  formación  de  expectativas.  En  última  instancia, 
un  buen  estratega  lo  será  por  su  capacidad  para  anticipar  el  comportamiento  de  los  demás. 
A la  hora  de  abordar  en  nuestros  modelos  el  problema  de  qué  tipo  de  expectativas  cabe 
esperar  que  tenga  un  jugador  y cuales  no,  es  útil  distinguir  entre  dos  posibles  enfoques: 

1.  un  enfoque  ex-ante  basado  en  la  introspección:  los  jugadores  utilizan  la  información  de 
que  disponen  para  «ponerse  en  los  pies  del  otro»  y tratar  de  anticipar  que  harán  o que 
no  harán  los  otros  jugadores. 

2.  un  enfoque  ex-post  basado  en  el  aprendizaje  o en  la  evolución:  aunque  en  principio  los 

jugadores  pueden  tener  cualquier  tipo  de  expectativas,  estas  irán  cambiando  y adap- 
tándose a la  información  que  reciban  los  jugadores  procedente  de  su  participación  de 
manera  repetida  en  situaciones  similares,  de  la  observación  de  los  resultados  que  ob- 
tienen otros  jugadores  en  función  de  las  estrategias  que  eligen, Lo  importante  en 

este  caso  es  el  tipo  de  expectativas  que  se  sostienen  después  de  ese  proceso. 

En  esta  apartado  vamos  a utilizar  el  primero  de  los  enfoques  para  tratar  de  avanzar  en  la 
caracterización  del  comportamiento  de  los  jugadores  en  el  marco  de  los  juegos  simultáneos 
con  información  completa.  La  primera  pregunta  que  debemos  hacernos  es,  por  tanto,  de 
qué  información  disponen  los  jugadores  en  este  tipo  de  juegos  y,  a partir  de  la  respuesta  a 
la  misma,  en  que  medida  es  posible  acotar  el  tipo  de  expectativas  que  se  pueden  formar. 
Evidentemente,  el  resultado  final  del  proceso  será  que  si  conseguimos  acotar  las  expectati- 
vas que  cabe  esperar  que  se  formen  los  jugadores  también  podremos  acotar  el  conjunto  de 
estrategias  entre  las  que  elegirán. 

Toda  la  información  de  la  que  dispone  un  jugador  en  el  tipo  de  juegos  que  estamos  estu- 
diando se  deriva  del  hecho  de  que  tanto  la  estructura  del  juego  como  la  racionalidad  de 
todos  los  jugadores  son  conocimiento  común.  El  conocimiento  común  de  la  estructura  del 
juego  supone  que  cada  jugador  conoce  de  manera  perfecta  las  alternativas  y las  preferencias 
de  cada  uno  de  los  otros,  pudiendo  ponerse  en  su  lugar  y considerar  su  problema  de  elec- 
ción en  las  mismas  condiciones  que  lo  hace  el  jugador  al  que  le  corresponde  decidir.  Supone, 
también,  que  cada  jugador  sabe  que  cada  uno  de  los  otros  dispone  de  información  para  plan- 
tearse igual  que  él  mismo  el  problema  de  decisión  al  que  se  enfrenta,  que  cada  jugador  sabe 
que  todos  saben  que  cada  uno  de  ellos  puede  ponerse  en  lugar  de  cada  uno  de  los  otros, ...  y 
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así  ad  infinitum.  Por  su  parte,  el  conocimiento  común  de  la  racionalidad  supone  que  cada 
jugador  anticipa  que  cada  uno  de  los  otros  sólo  elegirá  estrategias  que  sean  mejor  respuesta 
a sus  expectativas,  pero  también  que  cada  jugador  sabrá  que  los  otros  anticipan  que  sólo 
jugará  estrategias  que  sean  mejor  respuesta, ...  y así  indefinidamente. 

El  objetivo  es  determinar  las  expectativas  que  son  consistentes  con  ese  supuesto  de  que  la 
racionalidad  y la  estructura  del  juego  son  conocimiento  común  y,  partiendo  de  ahí,  el  con- 
junto de  estrategias  que  son  mejor  respuesta  a ese  subconjunto  de  expectativas  (que  son 
racionalizables).  Comenzaremos  considerando  situaciones  en  las  que  la  racionalidad  de  los 
jugadores  se  manifiesta  únicamente  en  términos  de  la  no  elección  de  estrategias  que  estén 
estrictamente  dominadas  por  otras,  dejando  para  el  final  el  caso  general  en  que  la  racionali- 
dad se  manifiesta  en  la  no  elección  de  estrategias  que  no  sean  mejor  respuesta  bajo  ninguna 
de  las  expectativas  posibles. 


2.4.2  Dominancia  iterada 

Consideremos,  a modo  de  ejemplo,  el  juego  de  la  Figura  2.9.  El  jugador  I no  tiene  ningu- 
na estrategia  dominante,  esto  es,  su  mejor  estrategia  depende  de  que  lo  que  haga  el  II.  En 
consecuencia,  antes  de  elegir  tratará  de  adivinar  que  estrategia  elegirá  el  otro  jugador.  Da- 
do que  es  un  juego  de  información  completa,  I conoce  la  función  de  ganancias  del  jugador 
II  y anticipa  que  elegirá  su  estrategia  dominante  Sui ■ En  otras  palabras,  las  únicas  expec- 
tativas consistentes  con  la  información  de  que  dispone  el  jugador  I son  por  tanto  aquellas 
que  asigna  probabilidad  1 a que  II  elija  Sjji-  Dadas  esas  expectativas,  la  elección  racional 
del  I es  su.  Dado  que  la  elección  del  II  no  depende  en  este  caso  de  las  expectativas  que  se 
forme,  tenemos  ya  una  propuesta  concreta  sobre  la  forma  en  que  se  desarrollará  el  juego:  la 
combinación  de  estrategias  (sji,Sjji). 


sin  sin 

511 

512 


4,4 

2,3 

2,2 

5,1 

Figura  2.9.  Un  juego  con  solución  por  dominancia  iterada 
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En  la  Figura  2.10  aparece  un  juego  en  forma  normal  que  también  tiene  solución  por  elimina- 
ción iterativa  de  estrategias  dominadas,  pero  en  este  caso  el  número  de  iteraciones  es  mayor. 


L 

C 

D 

A 

4,3 

5,1 

6,2 

M 

2,1 

8,4 

3,6 

C 

3,0 

9,6 

2,8 

Figura  2.10.  Un  juego  con  solución  por  dominancia  iterada 


Únicamente  existe  una  estrategia  dominada,  la  C para  el  jugador  II.  A la  hora  de  elegir  entre 
las  estrategias  restantes,  cada  jugador  necesariamente  ha  de  formarse  unas  expectativas  so- 
bre lo  que  hará  el  otro.  Vamos  a ponernos  en  lugar  de  cada  uno  de  ellos,  tratando  de  analizar 
su  elección: 

■ Jugador  I 

1.  La  mejor  alternativa  para  mí  depende  de  lo  que  haga  II.  Dado  que  conozco  sus 
ganancias  (es  un  juego  de  información  completa),  sé  que  el  conoce  las  mías,  sé  que 
el  sabe  que  yo  conozco  las  suyas, . . . voy  a intentar  tratar  de  anticipar  cual  puede 
ser  su  decisión. 

2.  II  no  jugará  C,  ya  que,  cualesquiera  que  sean  sus  expectativas  sobre  lo  que  yo 
voy  a hacer,  le  da  una  mayor  ganancia  D que  C.  Para  elegir  entre  L y D,  tratará 
de  anticipar  que  estrategia  elegiré  yo.  Como  conoce  mis  ganancias,  verá  que  mi 
elección  dependerá  de  las  expectativas  que  me  forme  sobre  como  elegirá  él.  Anti- 
cipará que  yo  creo  que  no  va  a jugar  nunca  C y,  en  consecuencia,  que  voy  a elegir 
A,  por  lo  que  a él  le  interesa  L. 

■ Jugador  II 

1.  No  me  interesa  jugar  C,  ya  que  decida  lo  que  decida  I,  es  mejor  para  mí  D. 

2.  Para  decidirme  entre  L y D,  necesito  conocer  cual  será  la  decisión  de  I.  Dado  que 
conozco  sus  ganancias,  sé  que  el  conoce  las  mías,  sé  que  el  sabe  que  yo  conozco 
las  suyas, . . . voy  a intentar  tratar  de  anticipar  cual  puede  ser  su  decisión. 
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3.  I anticipará  que  yo  no  voy  a elegir  nunca  C,  por  lo  que  elegirá  A.  Por  tanto,  me 
interesa  elegir  L. 

La  combinación  de  estrategias  (A,  L)  constituye,  por  tanto,  la  solución  por  dominancia  ite- 
rada de  este  juego. 

En  general,  el  procedimiento  a seguir  para  buscar  la  solución  consiste  en  identificar  prime- 
ro las  estrategias  dominadas  de  alguno  de  los  jugadores  y eliminarlas.  Dado  que  se  trata 
de  juegos  de  información  completa,  todos  los  jugadores  conocen  las  estrategias  dominadas 
de  los  otros  y anticipan  que  no  las  elegirán.  Una  vez  que  los  jugadores  asignan  probabi- 
lidad cero  a la  elección  de  determinadas  estrategias  por  parte  de  otros  jugadores,  pueden 
aparecer  nuevas  estrategias  dominadas,  procediendo  a una  segunda  ronda  de  eliminación. 
Si  este  proceso  nos  deja  con  una  única  estrategia  para  cada  jugador,  dicha  combinación  de 
estrategias  será  la  solución  del  juego  por  eliminación  iterativa  de  estrategias  dominadas. 

Definición  2.4.1  (Solución  por  dominancia  iterada)  Dado  un  juego  estático  en  forma  normal 
G,  si  la  eliminación  iterativa  de  estrategias  dominadas  nos  conduce  a una  única  estrategia  para  cada 
jugador,  dicha  combinación  de  estrategias  constituye  la  solución  por  dominancia  iterada  del  juego. 

► Ejercicio  2.4.1 

Determine  la  solución  por  eliminación  iterativa  de  estrategias  dominadas  del  siguiente 
juego: 


sin 

SH2 

SH3 

Sil 

8,3 

0,4 

4,4 

Sl2 

4,2 

1,5 

5,3 

SI3 

3,7 

0,1 

2,0 

Figura  2.11.  Matriz  de  pagos  para  el  Ejercicio  2.4.1 
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2.4.3  Racionalizabilidad 

En  el  proceso  de  eliminación  iterativa  de  estrategias  estrictamente  dominadas,  la  raciona- 
lidad de  los  jugadores  se  asocia  a la  no  elección  de  estrategias  que  estén  estrictamente  do- 
minadas. Sin  embargo,  hemos  visto  anteriormente  que  la  racionalidad  de  los  jugadores  la 
hemos  de  interpretar  en  el  sentido  más  general  de  que  no  elegirán  nunca  estrategias  que  no 
sean  mejor  respuesta  bajo  alguna  de  las  expectativas  posibles  sobre  el  comportamiento  del 
resto.  Si  partimos  de  que  lo  que  es  conocimiento  común  es  precisamente  que  los  jugadores 
no  elegirán  estrategias  que  no  sean  mejores  respuesta  a alguna  de  las  expectativas  posibles 
(en  lugar  de  que  no  jugarán  estrategias  dominadas)  estaremos  aplicando  también  un  crite- 
rio de  selección  de  estrategias  más  general  que  el  de  la  dominancia  iterada  y que  se  conoce 
como  racionalizabilidad.  A modo  de  ejemplo,  el  juego  de  la  Figura  2.5  no  tiene  solución  por 
eliminación  iterativa  de  estrategias  dominadas,  pero  solamente  es  racionalizable  la  combi- 
nación de  estrategias  (sji,  Sjji).  En  cualquier  caso,  el  análisis  detallado  de  la  relación  entre 
dominancia  iterada  y racionalizabilidad  lo  aplazamos  hasta  que  se  introduzca  el  concepto 
de  estrategias  mixtas  en  los  próximos  temas. 

2.5  Dominancia  débil 

Hasta  el  momento  hemos  venido  utilizando  el  concepto  de  dominancia  estricta,  esto  es,  he- 
mos considerado  situaciones  en  las  que  unas  determinadas  estrategias  son  peores  que  otras 
hagan  lo  que  hagan  los  otros  jugadores.  Sin  embargo,  en  algunos  casos  puede  ocurrir  que 
una  determinada  estrategia  lleve  asociados  resultados  que  nunca  serán  peores  que  los  de 
otra,  pero  para  determinadas  casos  serán  iguales.  Las  definiciones  que  hemos  dado  ante- 
riormente de  estrategia  (estrictamente)  dominada  y estrategia  (estrictamente)  dominante  se 
extienden  de  manera  automática  a su  versión  débil: 

Definición  2.5.1  (Estrategia  débilmente  dominante)  Dado  G = (JriSi^'iUi}^),  la  es- 
trategia s¡  es  una  estrategia  (débilmente)  dominante  para  el  jugador  i si  y sólo  si:  Uí(sí,s_í ) > 
U¡(sí,S-í),  y s¡  E Sj,  Vs_¿  E Si  y existe  al  menos  una  combinación  de  estrategias  del  resto  de 
jugadores  s_¿  tal  que  íi¿(s¿,  s_¿)  > íi¿(s¿,  s_¿)Vs¿  E S¡. 


► Ejercicio  2.5.1 

Defina  estrategia  débilmente  dominada. 


La  pregunta  que  debemos  hacernos  ahora  es  si  la  búsqueda  de  soluciones  aplicando  el  crite- 
rio de  dominancia  estricta  puede  extenderse  al  de  dominancia  débil.  Consideremos,  a modo 
de  ejemplo,  que  el  modelo  de  la  recolección  de  setas  los  pagos  de  los  jugadores  fuesen  los 
que  se  recogen  en  la  Figura  2.12. 
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H M 


10,10 

20,0 

0,20 

20,20 

Figura  2.12.  A setas,  ¿hoy  o mañana?(b) 


Con  los  nuevos  pagos  la  estrategia  H sigue  dominando  a la  M para  ambos  jugadores,  pero 
ahora  lo  hace  débilmente  (conduce  a un  mayor  pago  si  el  otro  coge  H pero  daría  el  mismo 
pago  si  el  otro  coge  M).  ¿Existen  las  mismas  razones  para  proponer  (H,H)  como  solución 
que  si  la  dominancia  es  estricta?  La  elección  de  una  estrategia  débilmente  dominada  pue- 
de conducir  al  mismo  resultado  que  la  estrategia  que  la  domina,  algo  que  no  ocurre  si  lo 
que  elige  el  jugador  es  una  estrategia  estrictamente  dominada.  En  la  medida  que  para  unas 
determinadas  circunstancias  es  uno  de  los  mejores  cursos  de  acción  posibles,  no  podemos 
tildar  dicha  elección  de  irracional,  en  especial  en  marcos  en  los  que  existan  razones  para 
que  los  jugadores  crean  muy  probable  que  se  van  a dar  esas  circunstancias  (que  los  otros 
jugadores  van  a elegir  la  combinación  de  estrategias  para  los  que  la  estrategia  débilmente 
dominada  es  una  de  las  mejores  respuestas).  En  el  caso  de  nuestro  ejemplo,  podrían  existir 
características  de  la  situación  de  interdependencia  estratégica  que  no  hemos  incorporado  a 
nuestro  modelo  que  hiciesen  que  cada  jugador  confiase  en  que  el  otro  esperará  a mañana. 
En  ese  caso  (M,  M)  no  sería  descartable  como  solución  del  juego;  aún  más  se  trata  de  una 
solución  estable  en  un  sentido  que  analizaremos  en  el  próximo  tema. 

De  la  misma  manera,  podríamos  recurrir  a la  eliminación  iterativa  de  estrategias  débilmente 
dominadas  como  criterio  de  selección.  Dicho  criterio  descansaría  en  el  supuesto  de  que  es 
conocimiento  común  que  los  jugadores  no  eligen  estrategias  débilmente  dominadas,  por  lo 
que  presentaría  el  mismo  inconveniente  que  acabamos  de  señalar.  Dado  que  una  estrategia 
débilmente  dominada  si  es  mejor  respuesta  (aunque  haya  otras  que  también  lo  son)  para 
unas  determinadas  expectativas,  puede  ser  racionalizable. 

En  definitiva,  cuando  recurramos  a la  eliminación  de  estrategias  débilmente  dominadas  de- 
bemos ser  especialmente  cuidadosos,  ya  que  su  aplicación  no  tiene  una  base  sólida  en  la 
racionalidad  (y  el  hecho  de  que  la  misma  sea  conocimiento  común),  algo  que  si  ocurría  en  el 
caso  de  la  dominancia  estricta. 


Prof.  Pedro  Álvarez  Caúselo 

Departamento  de  Economía  - Universidad  de  Cantabria 


22 


Apuntes  de  Teoría  de  Juegos  - Curso  2012-2013 
Material  publicado  bajo  licencia  Creative  Commons 


2 Juegos  estáticos  (I) 


2.6  Ejercicios 

► Ejercicio  2.6.1 

Ponga  algún  ejemplo  de  situaciones  tipo  dilema  del  prisionero. 


► Ejercicio  2.6.2 

En  un  concurso  de  televisión  dos  participantes  elegidos  al  azar  trabajan  en  equipo  para 
conseguir  la  mayor  cantidad  de  dinero  posible^.  A continuación  han  de  decidir  de  ma- 
nera simultánea  entre  dos  opciones,  amigo  o enemigo,  determinándose  el  premio  de  cada 
uno  de  ellos  de  la  siguiente  manera: 

■ si  los  dos  eligen  amigo,  se  reparten  la  cantidad  acumulada  x a partes  iguales; 

■ si  uno  elige  amigo  y el  otro  enemigo,  éste  último  se  lleva  todo; 

■ si  ambos  eligen  enemigo,  ninguno  de  los  dos  se  lleva  nada. 

Se  pide: 

1.  Haga  la  representación  en  forma  normal  de  esta  situación  de  interdependencia 
estratégica. 

2.  ¿Se  corresponde  con  una  situación  tipo  Dilema  del  Prisionero?  Explique  su  res- 
puesta. 

3.  Comente  los  factores  que  considere  que  pueden  influir  en  la  decisión  de  los  con- 
cursantes. 

flLa  situación  de  interdependencia  estratégica  que  se  recoge  en  este  ejercicio  se  corresponde  con  la 
planteada  en  el  concurso  Friend  or  Foe  emitido  por  el  canal  americano  Game  Show  Channel  por  primera 
vez  en  el  año  2002.  En  You  Tube  pueden  encontrarse  muchos  videos  con  programas  grabados.  Otro  video 
interesante  relacionado  con  un  concurso  similar  puede  verse  aquí. 

► Ejercicio  2.6.3 

Para  el  juego  de  la  figura  adjunta: 

1.  Exprese  mediante  un  vector  el  conjunto  de  posibles  expectativas  de  cada  uno  de 
los  jugadores. 

2.  A partir  de  dichos  vectores,  exprese  las  loterías  asociadas  a cada  estrategia  del 
jugador  II. 

3.  Determine  la  estrategia  óptima  del  jugador  II  bajo  el  supuesto  de  que  asigna  la 
misma  probabilidad  a cada  una  de  las  estrategias  del  jugador  I. 
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4.  Ponga  algún  ejemplo  de  expectativas  que  llevaría  al  jugador  I a elegir  su  estrategia 
Sil- 


sin 

SII2 

SlI3 

Sil 

2,2 

4,2 

3,4 

SI2 

4,-2 

1/3 

2,1 

SI3 

3,3 

1,1 

5,-1 

Figura  2.13.  Matriz  de  pagos  para  el  Ejercicio  2.6.3 


► Ejercicio  2.6.4 

Dado  el  juego  de  la  figura  adjunta,  determine  para  cada  jugador  el  conjunto  de  estrate- 
gias que  serían  mejor  respuesta  bajo  alguna  de  las  expectativas  posibles. 


sin 

SH2 

SH3 

Sil 

0,3 

6,4 

3,1 

Sl2 

5,1 

2,2 

2,0 

SI3 

2,2 

3,0 

0,1 

Figura  2.14.  Matriz  de  pagos  para  el  Ejercicio  2.6.4 


► Ejercicio  2.6.5 

Determine  la  solución  por  eliminación  iterativa  de  estrategias  dominadas  del  juego  cuya 
matriz  de  pagos  aparece  en  la  Figura  2.16. 
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Slll 

SlI2 

SlI3 

Sil 

8,5 

14,9 

1,12 

SI2 

6,1 

24,3 

3,0 

SI3 

5,7 

16,1 

2,9 

Figura  2.15.  Matriz  de  pagos  para  el  Ejercicio  2.6.5 

► Ejercicio  2.6.6 

Determine  las  combinaciones  de  estrategias  racionalizables  para  el  siguiente  juego: 


Sil 

Sl3 

Figura  2.16.  Matriz  de  pagos  para  el  Ejercicio  2.6.6 


Slll  SII2  SII3 


2,4 

12,0 

-4,  -4 

3,  -4 

2,0 

2,8 

► Ejercicio  2.6.7 

Adivinando  la  media.  Cada  uno  de  los  individuos  de  un  grupo  ha  de  elegir  de  forma 
simultánea  un  número  entre  el  1 y el  100,  ambos  inclusive.  A partir  de  todos  los  números 
elegidos  se  calcula  la  media  y el  individuo  cuyo  número  esté  más  próximo  a las  | partes 
de  la  misma  se  le  ofrece  un  determinado  premio.  Determine  la  solución  por  eliminación 
iterativa  de  estrategias  dominadas  de  este  juego. 

► Ejercicio  2.6.8 

Considere  una  situación  conocida  como  la  paradoja  del  presidente.  Tres  individuos,!, 
II,  y III  tienen  que  elegir  por  votación  entre  tres  alternativas  A,B  y C.  Las  reglas  de  la  vo- 
tación establecen  que  se  llevará  a cabo  aquella  alternativa  que  obtenga  más  votos,  y que 
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en  caso  de  empate  decidirá  el  voto  del  presidente.  Las  preferencias  de  cada  individuo 
vienen  dadas  por: 


A y¡  B y¡  C;  B y ¡¡  C y¡j  A;  C y¡¡  A y ni  B 

Busque  la  solución  por  eliminación  iterativa  de  estrategias  débilmente  dominadas  y ex- 
plique a continuación  porque  se  habla  de  paradoja. 


► Ejercicio  2.6.9 

Una  subasta  de  segundo  precio  es  aquella  cuyas  reglas  establecen  que  el  mejor  postor 
se  adjudicará  el  objeto  de  la  subasta  pero  pagando  únicamente  el  importe  de  la  segunda 
mejor  puja  (está  implícito  por  ejemplo  en  las  subastas  de  Ebay).  Discuta  de  manera  in- 
formal la  influencia  sobre  el  comportamiento  de  los  participantes  en  una  subasta  de  este 
tipo  de  regla  en  relación  con  la  alternativa  de  que  el  ganador  tenga  que  pagar  el  importe 
de  su  puja  (subasta  de  primer  precio). 

Represente  esta  situación  como  un  juego  en  forma  estratégica  y demuestre  que  en  la 
subasta  de  segundo  precio  existe  una  solución  por  dominancia  débil  consistente  en  que 
cada  jugador  hace  una  puja  igual  a su  precio  de  reserva  . 


► Ejercicio  2.6.10 

Considere  la  situación  de  interdependencia  estratégica  asociada  a la  elección  por  los 
alumnos  de  una  determinada  clase  de  un  delegado  mediante  votaciones  a sobre  cerrado. 

1.  Considere  inicialmente  que  se  presentan  dos  candidatos  A y B y responda  a las 
siguientes  cuestiones. 

a)  Represente  esta  situación  como  un  juego  en  forma  normal. 

b ) Considere  un  estudiante  que  prefiere  como  delegado  al  candidato  A y de- 
muestre que  la  estrategia  votar  A es  para  él  una  estrategia  débilmente  domi- 
nante. 

2.  Considere  ahora  que  se  presentan  tres  candidatos.  A,  B y C. 

a)  Represente  al  situación  como  un  juego  en  forma  normal. 

b ) Considere  un  estudiante  que  prefiere  como  delegado  al  candidato  A y deter- 
mine si  tiene  alguna  estrategia  débilmente  dominante.  Compruebe  a conti- 
nuación si  alguna  de  las  estrategias  está  débilmente  dominada. 
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3 Juegos  estáticos  (II) 


3.1  Introducción 

En  el  tema  anterior  hemos  abordado  el  proceso  de  formación  de  expectativas  a partir  del  su- 
puesto de  que  tanto  la  estructura  del  juego,  como  la  racionalidad,  eran  conocimiento  común. 
A partir  de  ese  supuesto,  descartábamos  determinados  tipos  de  expectativas  y,  como  conse- 
cuencia, la  elección  de  determinadas  estrategias.  El  resultado  era  la  selección  de  un  conjunto 
más  reducido  de  combinaciones  posibles  de  estrategias  que  cumplían  la  propiedad  de  ser 
racionalizables. 

Frente  a este  enfoque  ex-ante,  en  el  que  los  jugadores  se  -ponen  en  los  pies  de  los  otros  para  inten- 
tar anticipar  su  comportamiento,  cabe  adoptar  un  enfoque  ex-post,  en  el  que  los  jugadores 
se  forman  sus  expectativas  a partir  de  la  experiencia  derivada  de  la  participación  de  manera 
repetida  en  el  mismo  tipo  situaciones  de  interdependencia  estratégica.  Desde  este  punto  de 
vista,  la  idea  de  equilibrio  conduce  de  manera  natural  a proponer  como  condición  que  debe 
cumplir  una  combinación  de  estrategias  para  ser  solución  de  un  juego  que  en  la  misma  cada 
jugador  este  adoptando  una  estrategia  que  sea  la  mejor  respuesta  a las  estrategias  del  resto 
de  jugadores.  Si  esto  se  cumple,  estaríamos  ante  un  estado  estacionario  en  el  que  los  jugado- 
res verían  ex-post  que  la  estrategia  elegida  les  ha  llevado  a los  mejores  resultados  posibles. 
Esa  propiedad  de  que  una  combinación  de  estrategias  de  ser  simultáneamente  mejor  res- 
puesta para  todos  los  jugadores,  es  precisamente  la  característica  del  concepto  de  solución 
más  conocido  en  la  teoría  de  juegos,  el  de  equilibrio  de  Nash.  En  la  primera  parte  del  tema 
se  define  este  concepto  y se  explica  la  forma  habitual  de  determinar  las  combinaciones  de 
estrategias  que  son  equilibrio  de  Nash  a partir  de  las  funciones  de  mejor  repuesta. 

En  la  segunda  parte  del  tema  se  aborda  la  ampliación  del  espacio  de  elección  de  los  jugado- 
res, permitiendo  ahora  que  puedan  elegir  estrategias  mixtas.  Cada  jugador  en  lugar  de  poder 
elegir  únicamente  entre  sus  estrategias  puras,  podrá  ahora  escoger  una  regla  para  seleccionar 
de  manera  aleatoria  entre  ellas.  Una  vez  definidas  las  estrategias  mixtas,  abordaremos  de 
nuevo  la  caracterización  del  comportamiento  de  los  jugadores  en  este  marco  ampliado.  Ex- 
tenderemos el  concepto  de  equilibrio  de  Nash  al  caso  de  estrategias  mixtas  y veremos  como 
afecta  al  análisis  en  términos  de  dominancia  y racionalizabilidad  que  hemos  realizado  en  el 
Tema  2.  Para  concluir  el  tema,  se  presenta  una  discusión  muy  general  sobre  el  concepto  de 
equilibrio  de  Nash,  a la  vez  que  se  aborda  el  problema  de  la  existencia,  la  unicidad  y,  en  su 
caso,  la  selección  de  uno  de  los  equilibrios  de  un  juego  como  solución  del  mismo. 
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3.2.  Equilibrio  de  Nash 


3.2  Equilibrio  de  Nash 

3.2.1  Concepto 

Consideremos  el  juego  de  la  Figura  3.4  y supongamos  que  existe  una  población  de  indivi- 
duos que  se  enfrentan  de  forma  repetida,  pero  anónima1,  a este  tipo  de  situación  de  inter- 
dependencia estratégica.  Cada  jugador  se  enfrenta,  por  tanto,  muchas  veces  a ese  tipo  de 
situación,  pero  cada  una  de  ellas  con  rivales  distintos.  Bajo  esta  perspectiva,  resulta  lógico 
preguntarnos  si  cabe  esperar  que  surja  una  manera  estable  de  desarrollarse  el  juego,  esto  es, 
que  siempre  que  los  jugadores  se  enfrenten  a una  situación  de  este  tipo  jueguen  de  la  misma 
manera.  Si  así  fuese,  la  combinación  de  estrategias  propuesta  como  forma  estable  de  desa- 
rrollarse el  juego  debería  servir  de  base  para  la  formación  de  expectativas  de  los  jugadores  y, 
además,  debería  ser  racional,  en  el  sentido  de  que  cada  jugador  esté  eligiendo  una  estrategia 
óptima  dadas  esas  expectativas.  En  otras  palabras,  si  un  juego  tiene  una  forma  estable  de 
jugarse,  entonces: 

■ las  expectativas  de  cada  jugador  cada  vez  que  se  enfrente  a una  situación  de  ese  tipo 
deberían  ser  que  el  otro  se  comportará  como  lo  hacen  siempre  jugadores  de  ese  tipo  en  estas 
situaciones ; 

■ cada  jugador  debería  estar  adoptando  una  estrategia  que  fuese  la  mejor  respuesta  a 
esas  expectativas. 

Consideremos  la  combinación  de  estrategias  (sj 2,  S773)  y veamos  si  cumple  estas  condiciones. 
Si  el  jugador  I creyese,  en  base  a su  experiencia  previa,  que  los  de  tipo  II  siempre  eligen  la 
estrategia  Su3  ciertamente  su  elección  sería  S72 . Sin  embargo,  si  el  jugador  II  creyese  que 
los  jugadores  de  tipo  I siempre  eligen  sn,  su  mejor  respuesta  no  sería  s/j 3,  sino  Su2-  En 
definitiva,  los  jugadores  de  tipo  II  jugarían  de  otra  manera,  las  expectativas  de  los  de  tipo  I 
también  serían  otras,  lo  que  les  llevaría  a su  vez  a jugar  de  otra  manera, 

Si  analizásemos,  una  por  una,  todas  las  combinaciones  de  estrategias  del  juego,  veríamos 
que  sólo  en  una  de  ellas,  la  (sj  1,  Sjji),  se  dan  esas  condiciones  de  consistencia  para  proponer- 
la como  forma  de  jugar  estable.  En  efecto,  si  cada  jugador  se  comportase  de  acuerdo  con  ella 
siempre  que  se  enfrentase  a una  situación  de  este  tipo,  vería  a posteriori  que  su  elección  ha 
sido  la  mejor  posible  dado  lo  que  ha  hecho  el  otro.  Cada  vez  que  se  enfrentase  a una  situa- 
ción como  ésta  no  tendría  razones  para  cambiar  sus  expectativas  y,  por  tanto,  tampoco  su 
comportamiento.  Lo  que  distingue  en  última  instancia  a la  combinación  (sji,S/n)  del  resto 
es  que  ambas  estrategias  son  simultáneamente  mejor  respuesta  la  una  a la  otra.  Un  equi- 

'En  el  caso  de  que  los  jugadores  asignasen  una  probabilidad  positiva  a volver  a enfrentarse  con  el  otro 
deberíamos  modelizarlo  como  un  juego  dinámico,  ya  que  en  este  caso  a la  hora  de  tomar  una  decisión  tendría 
en  cuenta  las  consecuencias  futuras  de  la  misma  (como  influirá  en  el  comportamiento  del  otro  en  el  futuro). 
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3 Juegos  estáticos  (II) 


librio  de  Nash  es  precisamente  una  combinación  de  estrategias  que  cumple  esa  condición: 

que  cada  jugador  esta  eligiendo  la  mejor  estrategia  posible  dadas  las  estrategias  elegidas 
por  los  otros. 


Slll  S112  SH3 


2,4 

5,0 

0,2 

0,0 

1/8 

4,6 

Figura  3.1.  Un  juego  con  un  equilibrio  de  Nash 


Definición  3.2.1  (Equilibrio  de  Nash)  Dado  un  juego  en  forma  normal,  G = (J,  (S¿}"=1,  (U¿}”=1), 
una  determinada  combinación  de  estrategias  s = (si, . . . ,sn)  constituye  un  equilibrio  de  Nash  del 
mismo  sí  y sólo  sí:  íi¿(s¿,s_¿ ) > U¿(s¿,s_¿),  Vs¿  G S¿,  Vi. 

Alternativamente: 

Definición  3.2.2  Dado  un  juego  en  forma  normal,  G = (/,  {S¡}”=1,  { Lí, } ”=1 ) , una  determinada 
combinación  de  estrategias  s = (si, . . . ,sn)  constituye  un  equilibrio  de  Nash  del  mismo  sí  y sólo 
sí:  §i  G arg  máxS;  ü¿(s¿,  s_¿),  i = l,...,n. 

A diferencia  del  tema  anterior,  el  criterio  para  caracterizar  la  elección  de  estrategias  por 
parte  de  los  jugadores  ya  no  es  la  racionalización  ex-ante  su  decisión  individual,  sino  la 
consistencia  ex-post  de  las  expectativas  y las  decisiones  de  todos  ellos.  Podemos  interpretar 
el  equilibrio  de  Nash  como  un  estado  estacionario,  en  el  sentido  de  que  si  los  jugadores 
observan  que  cada  vez  que  se  enfrentan  a esa  situación  se  desarrolla  conforme  a s ningún 
jugador  tiene  razones  para  cambiar  de  estrategia.  No  las  tiene  porque  esta  eligiendo  la  mejor 
respuesta  dadas  unas  expectativas,  y porque  dichas  expectativas  se  ven  confirmadas  cada 
vez  que  juega. 

Por  el  momento  vamos  a centrarnos  en  el  procedimiento  a seguir  para  determinar  los  equi- 
librios de  Nash  de  un  juego,  pero  volveremos  más  adelante  sobre  la  interpretación  y justifi- 
cación del  equilibrio  de  Nash  como  concepto  de  solución. 


3.2.2  Funciones  de  mejor  respuesta  y determinación  del  equilibrio  de  Nash 

El  procedimiento  habitual  a la  hora  de  determinar  los  equilibrios  de  Nash  de  un  juego  consta 
de  dos  pasos: 
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3.2.2.  Funciones  de  mejor  respuesta  y determinación  del  equilibrio  de  Nash 


1.  Búsqueda,  para  cada  jugador,  de  las  estrategias  que  constituyen  mejores  repuestas  a 
cada  posible  combinación  de  estrategias  del  resto  de  jugadores  : 

Bf(s-i)  : S_i  — > Si 

S -i  I — > {s*  : m¿(s*,s_¿)  > Mj(sf, s_¿)  Vs¿  G Sf}. 


Dado  que  para  determinadas  s_¡  el  jugador  z puede  tener  más  de  una  estrategia  que 
sea  mejor  respuesta,  es  en  general  una  correspondencia;  solamente  en  el  caso  en 

que  a cada  s_¿  le  corresponda  una  única  estrategia  óptima  estaremos  ante  una  función 
propiamente  dicha. 


2.  Determinación  de  todas  las  combinaciones  de  estrategias  que  son  simultáneamente 
mejores  respuestas  para  todos  los  jugadores: 


(si,s2/. . EN  <b>  s¡  G £>z(s_¿)  Mi. 


Ejemplo  3.2.1 

En  el  juego  representado  en  la  Figura  3.17  las  mejores  respuestas  de  un  jugador  a cada 
posible  estrategia  del  otro  se  señalan  subrayando  el  pago  correspondiente.  El  hecho  de 
que  solo  la  combinación  de  estrategias  (s/i,sm)  presente  los  dos  pagos  subrayados,  nos 
indica  que  constituye  el  único  equilibrio  de  Nash  del  juego. 


sin  sin 


Sil 


Sl2 


Sl3 


16,7 

3,5 

4,8 

22,6 

7,5 

19,9 

Figura  3.2.  Mejores  respuesta  y equilibrio  de  Nash 
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► Ejercicio  3.2.1 

Determine  todos  los  equilibrios  de  Nash  del  juego  que  aparece  en  la  figura  adjunta. 


sin 

S112 

SII3 

Sil 

1,4,3 

4,6,0 

1,2,2 

SI2 

2,8,2 

3,4, -1 

1,6,  — 1 

SI3 

2,2,1 

5,8,2 

2,4,0 

Sil  II 


sin 

S112 

S113 

Sil 

1,4,2 

3,6,1 

1,2,1 

S12 

2,2,1 

2,0,1 

1,0,2 

Sl3 

3,2, -1 

2,4,2 

2,6, -1 

sim 


Figura  3.3.  Un  juego  en  forma  estratégica  con  tres  jugadores,  en  el  cual  el  jugador 
III  elige  Sun  ó Sun 


► Ejercicio  3.2.2 

La  figura  adjunta  recoge  dos  versiones  de  un  un  juego  conocido  como  la  caza  del  ciervon. 
La  primera  versión  es  la  forma  habitual  de  presentar  la  situación  planteada  originalmen- 
te por  Rousseau;  la  segunda  es  una  variante  que  ha  sido  utilizada  — como  alternativa  al 
dilema  del  prisionero — para  explicar  el  dilema  de  la  seguridad  en  el  marco  de  las  relaciones 
internacionales. 

Determine  para  todos  los  equilibrios  de  Nash  del  mismo.  Compare  a continuación  esta 
situación  con  la  recogida  en  el  dilema  del  prisionero. 


L C R R 


L 

1,1 

1,0 

R 

2,2 

3,1 

C 

0,1 

3,3 

R 

1,3 

4,4 

Figura  3.4 
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3.2.3.  Equilibrio  de  Nash  y dominancia 


flSu  nombre  hace  referencia  a una  situación  planteada  por  Rousseau,  en  torno  a las  dificultades  que 
supone  para  el  logro  de  la  cooperación  entre  un  grupo  de  individuos  la  falta  de  confianza  de  unos  en  los 
otros.  La  caza  de  un  ciervo  requiere  el  esfuerzo  colectivo  de  un  grupo  de  individuos;  sin  embargo,  durante 
la  caza  a cada  cazador  le  puede  surgir  la  oportunidad  de  coger  una  liebre.  En  caso  de  que  un  individuo 
decida  tratar  de  coger  la  liebre,  el  grupo  no  cogerá  al  venado.  La  desconfianza  de  cada  individuo,  respecto 
al  comportamiento  de  los  otros  en  el  caso  de  que  les  salga  una  liebre,  puede  llevarles  a no  participar  en  la 
caza  en  grupo  o,  si  participa,  a dedicarse  a cazar  liebres.  Visto  desde  otro  punto  de  vista:  la  caza  en  grupo 
de  un  venado  requiere  un  marco  institucional  en  el  cuál  los  individuos  confíen  los  unos  en  los  otros. 


3.2.3  Equilibrio  de  Nash  y dominancia 
► Ejercicio  3.2.3 

Repase  el  Tema  2 y conteste  a continuación  a las  siguientes  cuestiones: 

í.  Una  estrategia  (estrictamente)  dominada,  ¿puede  formar  parte  de  un  equilibrio  de 
Nash?  ¿ Y una  estrategia  débilmente  dominada? 

2.  Si  aplicamos  el  procedimiento  de  la  eliminación  iterativa  de  estrategias  estricta- 
mente dominadas,¿podemos  eliminar  algún  equilibrio  de  Nash?  ¿Ocurre  lo  mismo 
si  lo  extendemos  a las  estrategias  débilmente  dominadas? 

3.  Una  estrategia  no  racionalizable,  ¿puede  formar  parte  de  un  equilibrio  de  Nash? 
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3 Juegos  estáticos  (II) 


3.3  Estrategias  mixtas 

3.3.1  Equilibrio  de  Nash  en  estrategias  mixtas:  un  ejemplo 

Consideremos  el  juego  representado  en  su  forma  estratégica  en  la  Figura  3.11.  Hemos  deno- 
minado al  mismo  «pares  o nones»  porque  la  situación  de  interdependencia  estratégica  que 
representa  se  corresponde  con  la  del  juego  popular  que  se  conoce  con  ese  nombre2. 


P N 


1,-1 

-1,  1 

-1,  1 

1,-1 

Figura  3.5.  «Pares  o nones» 


Podemos  comprobar  que  ninguna  de  las  cuatro  combinaciones  de  estrategias  posibles  cons- 
tituye un  equilibrio  de  Nash3. 

Sin  entrar  por  el  momento  en  la  justificación,  vamos  a considerar  ahora  que  los  jugadores 
en  lugar  de  elegir  una  única  estrategia,  lo  que  hacen  es  asignar  una  probabilidad  a cada  una 
de  ellas.  Resulta  útil  pensar  que  los  jugadores  lo  que  eligen  es  una  regla  para  seleccionar  de 
manera  aleatoria  entre  sus  estrategias  originales.  Denominaremos  a cada  una  de  esas  posi- 
bles reglas  estrategia  mixta  y a cada  una  de  las  estrategias  originales  estrategia  pura.  Una 
estrategia  mixta  es,  por  tanto,  una  distribución  de  probabilidad  sobre  el  conjunto  de  estrate- 
gias puras  {P,  N}.  Podemos  considerar  que  una  estrategia  pura  como  una  estrategia  mixta 
degenerada  que  asigna  toda  la  probabilidad  a una  de  las  alternativas.  Vamos  a representar  de 
manera  genérica  una  estrategia  mixta  cualquiera  para  el  jugador  I por  cq  = (p,  1 — p)  y una 
para  el  jugador  II  por  a¡¡  = (q,  1 — q). 

Consideremos  por  separado  el  problema  de  decisión  de  cada  uno  de  los  jugadores.  Si  comen- 
zamos poniéndonos  en  lugar  del  jugador  I,  su  ganancia  esperada  si  elige  una  estrategia  mix- 
ta cualquiera  a¡  = (p,  1 — p),  cuando  II  elija  a su  vez  una  mixta  cualquiera  a¡¡  = (q,  1 — q) 

2Aunque  en  el  juego  popular  cada  jugador  elige  libremente  el  número  de  dedos  que  saca  extendidos,  es 
inmediato  comprobar  que  lo  único  relevante  de  su  decisión  es  si  dicho  número  es  par  o es  impar. 

3Sea  cual  sea  el  desarrollo  del  juego,  el  jugador  que  pierde  siempre  tiene  una  estrategia  que  le  hubiese  dado 
una  mayor  ganancia  dada  la  elección  del  otro. 
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3.3.1.  Equilibrio  de  Nash  en  estrategias  mixtas:  un  ejemplo 


vendrá  dada  por4: 


Vifacrn)  = pVi{P,au)  + (1  — p)Vi(N,(rII) 

= picjU^P)  + (1  - q)Ui(P,N)]  + (1  - p)[qlh{N,P)  + (1  - q)lh{N,N)] 

= M1)  + +p( i - í?)(-1)  + (i  - p)q(-i)  + (i  - p)(i  - í?)](1) 

= 4 pq  — 2p  — 2q  + 10. 


(3.1) 

La  elección  de  una  estrategia  mixta  por  parte  del  jugador  I queda  totalmente  determinada 
por  el  valor  que  asigne  a p,  por  lo  que  podemos  plantear  su  problema  de  elección  en  tér- 
minos de  dicho  valor.  Partiendo  de  la  ecuación  3.3.1  y derivando  parcialmente  respecto  a p 
podemos  ver  su  influencia  sobre  la  ganancia  esperada  del  jugador  I: 


si  q > 0.5 

si  q = 0.5  (3.2) 

si  q < 0.5 

Estamos  ya  en  condiciones  de  determinar  la  mejor  respuesta  del  jugador  I (en  términos 
de  que  estrategia  mixta  elegir)  para  cada  posible  estrategia  mixta  del  jugador  II.  Aunque 
seguiremos  utilizando  la  notación  habitual  y denominaremos  Bj(cqj)  a la  correspondencia5 
de  mejor  respuesta  del  jugador  I,  recurriremos  a veces  a la  expresión  p*  (q)  por  resultar  más 
ilustrativa  en  algunos  casos.  Dicha  correspondencia  adopta  la  forma: 


auj 

a^T1 


>o, 

= 4íJ  - 2 = 0, 

<0, 


M^ií)  = p*(q) 


1,  si  q > 0.5 

< cualquier  pG  [0,1],  si  q — 0.5 
0,  si  q < 0.5 


(3.3) 


Podemos  representar  gráficamente  dicha  correspondencia: 


4En  lenguaje  matemático,  esta  ganancia  esperada  es  una  combinación  convexa  de  las  ganancias  asociadas 
a cada  uno  de  los  posibles  desarrollos  del  juego,  en  la  cual  los  pesos  de  cada  ganancia  posible  vienen  dados 
por  la  probabilidad  de  que  los  jugadores  elijan  la  combinación  de  estrategias  puras  que  lleva  a esa  ganancia. 

5En  la  medida  que  a algún  valor  de  q le  va  a corresponder  más  de  un  valor  de  p que  constituiría  una  mejor 
respuesta  estamos  ante  a una  correspondencia  y no  ante  una  función. 
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Figura  3.6.  Correspondencia  de  mejor  respuesta  del  jugador  I. Si  el  jugador  I asigna  una 
probabilidad  mayor  de  0.5  a que  el  jugador  II  elija  una  determinada  estrategia,  su  mejor 
respuesta  es  jugar  con  probabilidad  1 esa  misma  estrategia  ( I gana  si  los  dos  eligen  P o 
los  dos  eligen  N). Únicamente  en  el  caso  de  que  crea  igual  de  probable  que  el  otro  elija 
cualquiera  de  las  dos  estrategias  tendría  más  de  una  respuesta  óptima,  de  hecho  tendría 
infinitas:  su  ganancia  esperada  es  la  misma  elija  la  mixta  que  elija. 


Si  nos  ponemos  ahora  en  lugar  del  jugador  II  y repetimos  el  procedimiento  anterior,  obte- 
nemos como  correspondencia  de  mejor  respuesta: 


%(ci)  = q*(p) 


0,  si  p > 0.5 
< cualquier  p £ [ 0,1],  si  p = 0.5 

1,  si  p < 0.5, 


la  cual  aparece  representada  en  la  Figura  3.7 


(3.4) 
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3.3.1.  Equilibrio  de  Nash  en  estrategias  mixtas:  un  ejemplo 


Una  vez  tenemos  las  correspondencias  de  mejor  respuesta  para  ambos  jugadores,  estamos 
ya  en  condiciones  de  determinar  si  existen  o no  equilibrios  de  Nash  en  estrategias  mixtas 
para  este  juego.  Ampliando  el  concepto  visto  de  estrategias  puras  al  caso  de  mixtas,  un  par 
de  estrategias  (frufrú)  será  un  equilibrio  de  Nash  si  se  cumple  simultáneamente  que: 

<7/  <E  Bi(&u) 

<7/7  <E  B//(aj) 

La  Figura  3.8  nos  permite  apreciar  como  estas  condiciones  solo  se  cumplen  cuando  cada 
jugador  elige  la  estrategia  mixta  (0.5, 0.5),  esto  es,  adopta  la  regla  de  jugar  cada  una  de 
sus  dos  estrategias  con  la  misma  probabilidad.  Podríamos  decir  que  en  el  único  equilibrio 
de  Nash  del  juego  ambos  jugadores  se  comportan  de  manera  totalmente  impredecible,  en  el 
sentido  de  que  eligen  una  regla  de  comportamiento  que  asigna  la  misma  probabilidad  a 
cada  una  de  sus  estrategias  puras.  Podemos  interpretar  también  este  equilibrio  en  términos 
de  la  incertidumbre  que  a los  jugadores  les  interesa  crear  en  su  rival.  Que  el  EN  sea  (0.5, 0.5) 
nos  recuerda  que  no  es  suficiente  con  crear  incertidumbre  en  el  rival  sobre  la  estrategia 
pura  que  eligiremos,  sino  que  la  incertidumbre  creada  deber  ser  tal  que  el  rival  crea  que  es 
igual  de  probable  que  juguemos  cualquiera  de  nuestras  dos  estrategias  puras.  En  muchos 
juegos  de  envite  o incluso  en  las  competiciones  deportivas,  el  comportamiento  óptimo  de 
los  jugadores  es  «mezclar»  adecuadamente  entre  las  distintas  acciones  que  pueden  llevar  a 
cabo  (echar  un  farol  en  un  juego  de  envite,  elegir  el  tipo  de  golpe  por  parte  de  un  jugador 
de  tenis,. . . ). 
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Figura  3.8.  Equilibrio  de  Nash  en  estrategias  mixtas  para  el  juego  «pares  o nones». 


► Ejercicio  3.3.1 

Para  cada  uno  de  los  juegos  que  aparece  en  la  figura  adjunta,  determine: 

1.  la  correspondencia  de  mejor  respuesta  de  cada  uno  de  los  jugadores; 

2.  los  equilibrios  de  Nash  tanto  en  estrategias  puras  como  en  mixtas. 


F T P H 


F 

2,1 

0,0 

P 

3,3 

1,5 

T 

0,0 

1,2 

H 

5,1 

0,0 

Figura  3.9.  Matrices  de  pagos  para  los  juegos  «la  batalla  de  los  sexos»  (izquierda)  y 
«halcón  o paloma»  (derecha). 
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3.3.2  Equilibrio  de  Nash  en  estrategias  mixtas:  planteamiento  general 
Definición  de  estrategias  mixtas 

Dado  un  juego  en  forma  estratégica  G = (/,  {S¿}”=1,  {U¿}”=1)  y dado  el  conjunto  de  estra- 
tegias puras  de  uno  cualquiera  de  los  jugadores  S,  = (sq, . . . , s¡x},  se  define  una  estragia 
mixta  para  dicho  jugador  como  una  distribución  de  probabilidad  sobre  S¡ : 

(c¿T,  • • • / Vík),  1/ 

k 

donde  cr^  = Pr[s¡  = s^],  esto  es,  cada  elemento  de  o¿  representa  la  probabilidad  que  el 
jugador  i asigna  a su  estrategia  pura  s¿-. 

En  este  marco  ampliado,  en  el  que  los  jugadores  pueden  elegir  estrategias  mixtas,  designa- 
remos por  tr  a una  combinación  de  estrategias  mixtas  (una  para  cada  jugador). 

Al  ampliar  el  espacio  de  elección  de  los  jugadores  incluyendo  la  posibilidad  de  que  elijan 
estrategias  mixtas,  con  cada  combinación  de  estrategias,  tr,  no  irá  asociado  un  desarrollo 
del  juego,  sino  distintos  desarrollos  cada  uno  de  ellos  con  una  determinada  probabilidad. 
Abusando  de  la  notación,  podemos  expresar  la  ganancia  esperada  6 del  jugador  i cuando 
cada  uno  de  los  jugadores  elige  una  estrategia  mixta  cr¡  como: 


V¡(<r) 


L 


riP¿(s)LT¿(s) 


esto  es,  la  ganancia  esperada  para  el  jugador  i será  una  suma  ponderada  de  las  ganancias 
asociadas  a cada  posible  combinación  de  estrategias  puras  s,  donde  las  ponderaciones  vie- 
nen dadas  por  la  probabilidad  de  que  el  juego  se  desarrolle  conforme  a dicha  combinación 
de  estrategias  puras.  En  la  medida  que  los  jugadores  eligen  de  manera  independiente,  la  pro- 
babilidad de  que  el  juego  se  desarrolle  conforma  a s será  el  producto  de  las  probabilidades 
que  cada  jugador  j asigna  a la  estrategia  Sj  que  forma  parte  de  s. 


6La  elección  de  una  estrategia  mixta  por  parte  del  jugador  i lleva  asociada  para  él  una  lotería  que  tiene  por 
soporte  las  ganancias  asociadas  a cada  combinación  de  estrategias  puras.  Como  señalábamos  en  el  Tema  1, 
procederemos  suponiendo  que  los  jugadores  tienen  como  objetivo  maximizar  su  ganancia  esperada,  supuesto 
que  tiene  dos  posibles  justificaciones: 

■ considerar  que  los  jugadores  son  neutrales  al  riesgo,  esto  es,  que  sólo  se  fijan  en  su  ganancia  (monetaria) 
esperada. 

■ considerar  que  los  pagos  que  asociados  a cada  combinación  de  estrategias  puras  vienen  dados  en  valores 
de  una  función  de  utilidad  cardinal.  En  este  caso,  los  jugadores  estaría  deciendo  conforme  al  criterio  de 
maximizar  la  utilidad  esperada. 
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► Ejercicio  3.3.2 

Considere  el  juego  «Papel,  piedra  o tijeras»  con  el  supuesto  adicional  de  que  si  uno  de 
los  jugadores  pierde  ha  de  pagar  10  € al  otro.  Se  pide: 

1.  Defina  una  estrategia  mixta  para  cada  uno  de  los  jugadores. 

2.  Represente  la  ganancia  esperada  de  cada  uno  de  los  jugadores  como  una  suma 
ponderada  de  las  ganancias  asociadas  a cada  combinación  de  estrategias  puras. 

3.  Este  juego  tiene  un  único  equilibrio  de  Nash  en  estrategias  mixtas.  ¿Cuál  cree  que 
es?  ¿Cuál  es  la  ganancia  esperada  para  un  jugador  en  dicho  equilibrio? 


Equilibrio  de  Nash  en  estrategias  mixtas 

Definición  3.3.1  (Equilibrio  de  Nash  en  estrategias  mixtas)  Dado  un  juego  en  forma  normal, 
G = (/,  {SiYU,  {U¿}”=i),  una  determinada  combinación  de  estrategias  mixtas  & = (oí,. . . , crn) 
constituye  un  equilibrio  de  Nash  en  estrategias  mixtas  del  mismo  sí  y sólo  sí: 

Vi(airfr_i)  > Vi{ai,d--i),\l(Ti  <E  E¿,  Vi. 

Como  vimos  en  el  ejemplo  con  el  que  comenzábamos  esta  sección,  al  menos  para  los  juegos 
2X2  es  posible  determinar  los  equilibrios  de  Nash  en  estrategias  mixtas  mediante  un  proceso 
similar  a como  lo  hacíamos  en  el  caso  de  las  puras: 

1.  determinamos  la  correspondencia  de  mejor  respuesta  de  cada  jugador 

2.  serán  equilibrios  de  Nash  aquellas  combinaciones  de  estrategias  mixtas  a que  perte- 
nezcan simultáneamente  a todas  las  correspondencias  de  mejor  respuesta: 

d-EN^d-i  e i = l,2,...,N. 

Existe,  sin  embargo,  un  procedimiento  alternativo  que  se  fundamenta  en  el  hecho  de  que  la 
ganancia  esperada  de  cualquier  estrategia  mixta  es  la  suma  ponderada  (por  las  probabilida- 
des correspondientes)  de  las  ganancias  asociadas  a sus  estrategias  puras: 

Vfcr)  = £ P1[sl]Vl(sl/cr_i), 

S¡eS; 

donde  P¿[s¿]  es  la  probabilidad  que  asigna  i a su  estrategia  pura  s¿  y donde  V¿(s¡,  ú_¿)  re- 
coge la  ganancia  esperada  del  jugador  i cuando  él  elige  la  estrategia  pura  s¿  y el  resto  de 
jugadores  la  combinación  de  estrategias  mixtas  cr_t-.  Como  consecuencia  de  ello,  para  que 
una  estrategia  mixta  ú,  forme  parte  de  un  equilibrio  de  Nash,  todas  las  estrategias  puras  a 
las  que  asigna  probabilidad  positiva  deberán  tener  la  misma  ganancia  esperada  (en  caso 
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contrario  existiría  mejores  respuestas  que  esa:  aquellas  estrategias  mixtas  que  reasignaran 
la  probabilidad  de  las  estrategias  puras  con  ganancias  esperadas  más  bajas  a las  estrategias 
puras  con  ganancias  esperadas  más  altas). 

A modo  de  ejemplo,  si  aplicamos  esto  al  juego  «pares  o nones»,  tendríamos  que  para  el 
jugador  I se  debería  cumplir: 

V^P^n)  = V^N'au)  ^ q(l)  + (1  - q)(- 1)  = q(~  1)  + (1  - q)(l), 

condición  que  nos  permite  derivar  un  único  valor  de  q que  es  justamente  el  asociado  a la 
estrategia  mixta  del  jugador  II  en  el  único  equilibrio  de  Nash  del  juego  fru  = (j,  j). 

A su  vez  para  el  jugador  II  se  debería  cumplir: 


Vnín.P)  = V„(ar,N ) ^ p(- 1)  + (1  - P)(  1)  = p(  1)  + (1  - P)(- 1). 


condición  que  nos  permite  determinar  en  este  caso  a¡. 


► Ejercicio  3.3.3 

Utilice  el  procedimiento  anterior  para  determinar  el  equilibrio  de  Nash  en  mixtas  del 
juego  «halcón  o paloma»  y del  juego  «papel,piedra  o tijeras». 


Estrategias  mixtas  y dominancia 

En  el  Tema  2 definimos  el  concepto  de  dominancia  aplicado  únicamente  al  caso  de  estrate- 
gias puras.  Una  estrategia  pura  dominaba  a otra  si  daba  mayor  ganancia  que  ella  fuese  cuál 
fuese  la  combinación  de  estrategias  elegida  por  los  otros  jugadores.  Vamos  a extender  aho- 
ra ese  el  concepto  de  dominancia  al  caso  en  el  que  los  jugadores  pueden  elegir  estrategias 
mixtas: 

Definición  3.3.2  (Dominancia  en  estrategias  mixtas)  DadoG  = (/,  {S;}-^,  { Uj}^) , una  es- 
trategia pura  Si  esta  dominada  para  el  jugador  i si  existe  otra  estrategia  (pura  o mixta)  G A (S¿)  tal 
que  V¿(<7¿,  s_¿)  > Vj-(s¿,s _¿),  Vs_¿  G S_¿. 

La  condición  ahora  para  que  una  estrategia  mixta  domine  a una  pura  es,  por  tanto,  que  la 
ganancia  esperada  jugando  la  mixta  sea  mayor  que  la  ganancia  esperada  jugando  la  pura, 
sean  cuales  sea  cual  sea  las  estrategias  puras  elegidas  por  los  otros  jugadores. 


► Ejercicio  3.3.4 
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Tomando  como  referencia  un  juego  sencillo  con  dos  jugadores  y tres  estrategias  para 
cada  uno  de  ellos,  demuestre  que  si  se  cumple  s_¿)  > V¿(s¿,  s_¿)  Vs_¡  G S_¿,  en- 
tonces también  se  cumplirá  que  V¿(ú¿,  tr_¿)  > V¿(s¿,  ít_¿)  Vít_¿  G A(S_¿). 


Nos  encontraremos,  por  tanto,  con  situaciones  en  las  cuales  una  estrategia  pura  esta  domi- 
nada por  una  estrategia  mixta  aún  cuando  no  lo  este  por  ninguna  otra  estrategia  pura.  Con- 
sideremos, a modo  de  ejemplo,  en  el  juego  representado  en  la  Figura  3.10.  Claramente  no 
existe  ninguna  estrategia  pura  que  este  dominada  por  otras  estrategias  puras  para  ninguno 
de  los  jugadores.  Sin  embargo,  es  inmediato  comprobar  que,  para  el  jugador  I,  existen  estra- 
tegias mixtas  que  dominan  a la  estrategia  pura  B,  por  ejemplo  la  estrategia  mixta  cr¡  = (.5,  .5) 
que  asigna  la  misma  probabilidad  a sus  estrategias  A y M. 


► Ejercicio  3.3.5 

Determine  todas  las  estrategias  mixtas  que  dominan  a la  estrategia  pura  B en  el  juego 
de  la  Figura  3.10. 


Revisión  de  la  relación  entre  estrategias  dominadas  y estrategias  mejor  respuesta 


Una  vez  consideramos  la  posibilidad  de  que  los  jugadores  elijan  estrategias  mixtas,  hemos 
de  reconsiderar  la  relación  que  habíamos  visto  en  el  Tema  2 entre  estrategias  dominadas 
y estrategias  mejor  respuesta.  Cuando  sólo  considerábamos  estrategias  puras,  veíamos  que 
podían  existir  estrategias  que  sin  estar  dominadas  por  otras  no  fuesen  mejor  respuesta  bajo 
ninguna  de  las  posibles  expectativas  que  se  pudiera  formar  el  jugador  correspondiente.  La 
pregunta  que  nos  falta  por  responder  es  qué  ocurrirá  ahora  si  eliminamos,  no  sólo  las  es- 
trategias que  están  dominadas  por  otras  puras,  sino  también  todas  aquellas  otras  que  estén 
dominadas  por  una  mixta.  La  respuesta,  que  no  entramos  a demostrar,  es  que  para  juegos 
con  solo  dos  jugadores,  si  ampliamos  el  espacio  de  elección  incluyendo  las  estrategias  mix- 
tas el  conjunto  de  estrategias  no  dominadas  para  un  jugador  coincide  con  el  conjunto  de 
estrategias  que  son  mejor  respuesta  bajo  alguna  de  sus  posibles  expectativas.  En  otras  pa- 
labras, en  un  juego  con  dos  jugadores,  si  una  estrategia  pura  no  está  dominada  (ni  por 
una  pura  ni  por  una  mixta)  existirán  unas  expectativas  bajo  las  cuales  es  mejor  respuesta. 
En  consecuencia,  para  juegos  con  dos  jugadores  el  conjunto  de  estrategias  racionalizadles 
para  cada  uno  de  ellos  puede  determinarse  aplicando  la  eliminación  iterativa  de  estrategias 
dominadas  (por  otras  estrategias  puras  o mixtas). 
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► Ejercicio  3.3.6 

Para  el  juego  de  la  figura  adjunta  hemos  demostrado  en  el  Tema  2 que  la  estrategia  S73 
no  es  mejor  respuesta  para  el  jugador  I bajo  ninguna  de  las  posibles  expectativas  que 
se  podría  formar  acerca  de  lo  que  hará  el  II.  Demuestre  que  existe  una  estrategia  mixta 
para  dicho  jugador  que  domina  a la  estrategia  S73. 


sin  sj¡2 


Sil 

Sil 

S 13 


10,2 

0,4 

0,1 

10,3 

4,8 

4,0 

Figura  3.10.  Mejor  respuesta  frente  a dominancia  estricta 


La  relación  entre  dominancia  y mejor  respuesta  es  un  poco  más  complicada  en  el  caso  de 
juegos  con  más  de  dos  jugadores,  por  lo  que  no  entramos  en  ella  por  el  momento7. 


7La  mayor  dificultad  va  asociada  al  tipo  de  expectativas  que  consideremos  se  puede  formar  cada  jugador 
sobre  lo  que  harán  los  otros,  en  particular,  la  posibilidad  de  que  crea  que  el  comportamiento  de  los  otros  esta 
correlacionado. 
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3.4  El  equilibrio  de  Nash  como  concepto  de  solución 

3.4.1  Interpretación  del  equilibrio  de  Nash  como  concepto  de  solución 

Como  ya  hemos  comentado  anteriormente,  el  equilibrio  de  Nash  como  concepto  de  solución 
parte  de  un  enfoque  diferente  a al  de  la  racionalizabilidad.  En  este  último  caso  lo  único  que 
exigimos  es  que  los  jugadores  incorporen  en  sus  expectativas  el  hecho  de  que  la  racionali- 
dad es  conocimiento  común  (que  anticipen  que  los  otros  no  jugarán  estrategias  dominadas, 
que  anticipen  que  los  otros  anticiparán  que  él  no  va  a jugar  estrategias  dominadas,. . . En 
cambio,  utilizar  el  equilibrio  de  Nash  como  concepto  de  solución  supone  exigir  que  las  ex- 
pectativas de  cada  jugador  sobre  el  comportamiento  de  resto  sean  correctas.  ¿Cómo  puede 
justificarse  esa  consistencia  en  las  expectativas  de  todos  los  jugadores?  En  la  medida  que 
estamos  estudiando  juegos  estáticos,  dichas  expectativas  no  pueden  tener  su  origen  en  el 
conocimiento  previo  que  tengan  unos  jugadores  de  otros.  Entre  las  posibles  justificaciones 
de  esa  consistencia  entre  expectativas  y estrategias  cabe  destacar  las  siguientes: 

■ la  experiencia  acumulada  de  enfrentarse  a situaciones  similares  de  manera  repetida  en 
el  tiempo  con  otros  jugadores  o la  información  recibida  de  otros  jugadores  que  se  han 
enfrentado  a esa  situación; 

■ la  comunicación  previa  al  juego. 

En  relación  con  la  comunicación  previa  al  juego,  podemos  pensar  en  una  situación  en  la 
cual  los  jugadores  pueden  enviarse  mensajes  antes  de  elegir  una  estrategia  o incluso  pue- 
den negociar  entre  ellos.  En  este  caso,  si  se  pusiesen  de  acuerdo  sobre  una  forma  conjunta 
de  comportarse,  esta  debería  ser  un  equilibrio  de  Nash:  tiene  la  propiedad  de  que  existen 
incentivos  para  que  cada  jugador  elija  la  estrategia  acordada. 

Sin  embargo,  como  señalamos  al  principio  del  tema,  en  la  mayoría  de  las  ocasiones  toma- 
remos como  supuesto  básico  que  las  expectativas  de  los  jugadores  tienen  su  origen  en  su 
experiencia  previa  derivada  de  enfrentarse  a situaciones  de  interdependencia  estratégica 
similares.  Cada  jugador  tiene  experiencia  suficiente  como  para  anticipar  de  manera  correc- 
ta como  jugarán  los  otros  jugadores.  Resulta  útil  pensar  en  unas  condiciones  ideales  en  las 
cuales  para  cada  jugador  existe  una  población  de  individuos  que  puede  adoptar  ese  papel 
(la  misma  población  en  juegos  simétricos).  Cada  vez  que  se  produce  la  situación  de  inter- 
dependencia estratégica  un  jugador  de  cada  tipo  es  elegido  al  azar  de  la  correspondiente 
población,  de  tal  manera  que  cada  jugador  se  enfrenta  a una  misma  situación,  pero  con  riva- 
les distintos  cada  vez.  Esto  hace  que  cada  jugador  se  forme  unas  expectativas  sobre  lo  que 
hace  el  rival  típico  en  una  situación  de  ese  tipo,  no  sobre  lo  que  hacen  rivales  concretos  (en 
este  caso  deberíamos  modelizarlo  como  un  juego  dinámico  en  el  cuál  los  jugadores  tienen 
en  cuenta  los  efectos  futuros  de  las  decisiones  actuales).  Interpretado  así,  el  equilibrio  de 
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3.4.2.  Existencia  del  equilibrio  de  Nash 


Nash  se  corresponde  con  un  estado  estacionario:  si  cada  vez  que  se  produce  esa  situación 
de  interdependencia  estratégica  se  desarrolla  conforme  asno  existe  fuerza  alguna  que  tien- 
da a cambiar  la  forma  de  jugar  de  los  participantes.  En  otras  palabras,  el  equilibrio  de  Nash 
vendría  a ser  una  norma  social  estable:  si  todo  el  mundo  la  sigue  nadie  tiene  incentivos  a 
desviarse  8.  La  forma  de  justificar  la  estabilidad  del  comportamiento  puede  variar  de  una 
situación  a otra. 

Si  se  propone  una  combinación  de  estrategias  como  solución  estable  de  un  juego,  el  que  sea 
equilibrio  de  Nash  es  una  condición  necesaria  que  debemos  imponerle.  En  caso  de  que  la 
solución  propuesta  no  fuese  equilibrio  de  Nash,  deberíamos  justificar  el  hecho  de  que  al 
menos  un  jugador  no  este  adoptando  la  mejor  respuesta  al  comportamiento  de  resto.  Sin 
embargo,  puede  haber  situaciones  de  interdependencia  estratégica  en  las  que  un  posible 
desarrollo  del  juego  no  sea  un  buen  candidato  a solución  a pesar  de  ser  un  equilibrio  de 
Nash  (que  sea  equilibrio  de  Nash  no  es  condición  suficiente  para  ser  solución). 

3.4.2  Existencia  del  equilibrio  de  Nash 

Nash  (1950)  demostró  que  todo  juego  finito  (ha  de  serlo  S,  esto  es,  el  número  de  jugadores 
y el  espacio  de  estrategias  de  cada  uno  de  ellos)  tiene  almenos  un  equilibrio  de  Nash,  que 
puede  serlo  en  estrategias  mixtas.  Este  resultado  se  conoce  como  teorema  de  Nash. 

► Ejercicio  3.4.1 

Demuestre  el  teorema  de  Nash  para  juegos  2X2  utilizando  la  siguiente  representación 
general: 


Sin  Sin 

Su 
S12 


a,  oí 

c,7 

d,8 

Figura  3.11.  Una  matriz  de  pagos  generalizada  para  juegos  2X2. 


8 A modo  de  ejemplo,  en  el  equilibrio  de  Nash  del  modelo  de  Cournot  cada  una  de  las  empresas  compro- 
baría ex  post  que  al  precio  que  se  realiza  en  el  mercado  no  tiene  ningún  incentivo  en  cambiar  la  cantidad  que 
saca  al  mercado.  De  la  misma  manera,  en  el  ejercicio  sobre  el  reparto  del  tráfico  entre  dos  vías  alternativas  en 
el  equilibrio  de  Nash  ningún  conductor  tendría  incentivos  a cambiar  de  ruta. 
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Suponga  que  todos  los  parámetros  son  positivos  y que  a / c,b  / d;a.  / f>, 7 / á. 


3.4.3  Unicidad  y selección  de  equilibrios 

Es  habitual  encontrarnos  con  juegos  que  presentan  más  de  un  equilibrio  de  Nash.  En  rela- 
ción con  ello  debemos  recordar  que  resulta  útil  considerar  el  equilibrio  de  Nash  como  una 
condición  necesaria,  pero  no  suficiente,  para  proponer  una  combinación  de  estrategias  como 
solución  de  un  juego.  Ante  la  presencia  de  varios  equilibrios  de  Nash  existen  dos  grandes 
grupos  de  aproximaciones  para  seleccionar  alguno  de  ellos  como  solución: 

1.  Incorporando  información  adicional  a la  recogida  en  el  juego.  Un  juego  supone  una 
abstracción  de  la  situación  real  de  interdependencia  estratégica  y el  proceso  de  abs- 
tracción puede  suponer  la  eliminación  de  información  útil  para  ayudarnos  a seleccio- 
nar un  equilibrio  de  Nash.  A modo  de  ejemplo,  la  posibilidad  de  que  los  jugadores 
puedan  comunicarse  o negociar  entre  ellos  con  anterioridad  al  desarrollo  del  juego,  la 
presencia  de  convenciones  sociales  o de  puntos  focales,  el  aprendizaje  de  experiencias 
pasadas,  la  evolución, . . . pueden  fundamentar  la  elección  de  uno  de  los  equibrios  de 
Nash  como  solución. 

2.  Imponiendo  restricciones  teóricas  adicionales  ( refinamientos  del  equilibrio  de  Nash). 

En  los  temas  siguientes  veremos  algunos  ejemplos  como  la  perfección  en  subjuegos  o el 
equilibrio  secuencial. 
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3.5.  Aplicación  I:  El  modelo  de  oligopolio  de  Cournot 


3.5  Aplicación  I:  El  modelo  de  oligopolio  de  Cournot 

3.5.1  Introducción 

3.5.2  Modelo  de  duopolio  con  demanda  lineal  y rendimientos  constantes  a escala 

Consideremos  una  situación  en  la  cual  el  mercado  de  determinado  bien  es  abastecido  por 
dos  únicas  empresas.  Ay  B.  Los  costes  para  la  empresa  i de  poner  en  el  mercado  una  deter- 
minada cantidad  del  bien  x¡  vienen  dados  por  una  fución  C,(x¡)  que  vamos  a suponer  lineal 
e idéntica  para  ambas  empresas: 

Q(x¡)  = CX[  para  i = A,B.  (3.5) 

El  producto  se  vende  en  el  mercado  a un  precio  único  que  quedará  determinado  conjunta- 
mente por  la  cantidad  total  puesta  en  el  mercado  por  ambas  empresas  y por  la  demanda  del 
mismo,  la  cual  vamos  a suponer  también  lineal: 

p = a — bX.  (3.6) 

Esta  función  inversa  de  demanda  recoge  simplemente  una  dependencia  negativa  del  precio 
que  alcanzará  el  producto  en  el  mercado  con  la  cantidad  total  que  pongan  en  el  mismo  entre 
las  dos  empresas  X = x^  + xb- 

Vamos  a representar  esta  situación  de  ID  como  un  juego  en  forma  normal  como  paso  previo 
a la  determinación  del  EN  del  mismo. 


Representación  en  forma  normal 

■ J = {A,B}. 

■ S,  = {x¡  : X{  > 0}  para  i = A,B. 

■ 7ii(xi,Xj)  = x¡[a  — b(x¡  + Xj)  - c\  para  i = A,  B,  i ^ j. 

Una  vez  tenemos  planteada  la  situación  de  ID  como  un  juego,  podemos  recurrir  al  procedi- 
miento habitual  para  determinar  el  EN: 


Determinación  del  equilibrio  de  Nash 

Funciones  de  mejor  respuesta  B¡(xj)  Cada  empresa  tiene  que  decidir  la  cantidad  de  pro- 
ducto que  saca  al  mercado  sin  conocer  que  cantidad  sacará  la  otra.  Podemos  plantear  su 
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problema  de  decisión  como: 

máx  Tí[{x[,  Xj ) = máx  Xi[a  — b(x¡  + x¡)  — c\.  (3.7) 

Dado  que  la  función  objetivo  es  cóncava,  la  condición  de  primer  orden  será  a la  vez  necesaria 
y suficiente: 

-^(x*,  Xj)  = a — 2bx¡  — bxj  — c = 0. 

tf  Xj 

Como  podemos  apreciar,  dicha  condición  no  nos  dará  una  única  cantidad  óptima,  sino  una 
distinta  para  cada  posible  cantidad  que  saca  la  otra  empresa  Xj.  Se  trata,  pues,  de  una  función 
de  mejor  respuesta,  que  podemos  hacer  explícita  sin  más  que  despejar  x* : 


Xi 


a — c 1 

~W  ~ 2Xj' 


(3-8) 


Equilibrio  de  Nash  Tenemos  por  tanto  una  función  de  mejor  respuesta  para  cada  una  de 
las  empresas: 

* ® el 

XA  = ~2f  - 2Xb  (3-9) 

* ^ el  . . 

XB  = ~2f  - 2Xa ■ (3-10) 

El  equilibrio  de  Nash  del  juego  vendrá  dado  por  un  par  de  cantidades  (xa,  %b)  que  sean 
simultáneamente  mejor  respuesta  para  las  dos  empresas,  esto  es,  se  ha  de  cumplir  que: 

xa  = - 2Xb  (3-H) 

Xb  = ~ 2Xa ■ (3-12) 

Resolviendo  el  sistema  anterior  obtenemos  como  único  equilibrio  de  Nash  xa  = xg  = ^¡f. 


Valoración  de  los  resultados  de  equilibrio 


La  cantidad  total  sacada  al  mercado  en  el  equilibrio  de  Nash  es 


X = xa  + xB 

vaciándose  el  mercado  para  un  precio 

'2  (a  — c 


V = 


a — b 


3b 


2{a  — c) 

' 


a + 2c  a — c 

— ^ — = c H — . 
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3.5.2.  Modelo  de  duopolio  con  demanda  lineal  y rendimientos  constantes  a escala 


Figura  3.12.  Equilibrio  de  Cournot  Mis/;.  Única  mente  cuando  cada  empresa  esta  sacando 
al  mercado  una  cantidad  x¡  = se  cumple  que  cada  una  de  ellas  esta  respondiendo 
óptimamente  a la  cantidad  que  saca  la  otra. 


Por  tanto,  en  el  equilibrio  los  beneficios  de  cada  empresa  vendrán  dados  por: 

\2 


/ ^ ^ \ f Cl  C 

KiiXvXj)  = 


a c \ i ci  c 


[a  — c) 

9" 


Podemos  comparar  estos  resultados  de  equilibrio  con  los  que  se  darían  bajo  el  supuesto  de 
que  el  mercado  fuese  de  competencia  perfecta.  En  este  caso  la  libertad  de  entrada  y salida 
haría  que  el  precio  de  equilibrio  a largo  plazo  coincidiese  con  el  coste  unitario  de  producción, 
p = c,  siendo  la  cantidad  total  intercambiada  X(c)  = Si  consideramos  el  otro  extremo, 
con  el  mercado  controlado  por  un  monopolista,  podemos  plantear  su  problema  de  decisión 
como: 

máx  7r¿(x¿)  = máx[a  — bx¡  — c\. 

X¡ 

Aplicando  la  condición  de  primer  orden,  obtenemos  como  cantidad  óptima  a sacar  al  mer- 
cado Xm  = siendo  el  precio  que  vaciaría  el  mercado  Pm  = = c + 


La  siguiente  tabla  permite  recoge  de  manera  esquemática  la  comparación  entre  los  resulta- 
dos de  equilibrio  de  las  tres  estructuras  de  mercado. 
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Cournot 

Competencia 

perfecta 

Monopolio 

X 

2 (a~c) 

a—c 

1 a—c 

3 b 

b 

2 b 

p 

c+  V 

C 

C+  ^ 

n¡ 

(a-c)2 

9b 

0 

00  I 

Ni 

Cuadro  3.1.  El  equilibrio  de  Coumot-Nash  en  duopolio:  comparación  con  los  resultados 
del  equilibrio  competitivo  y del  monopolio.  La  cantidad  sacada  al  mercado  en  el 
equilibrio  de  Cournot-Nash  es  menor  que  la  del  equilibrio  competetivo  y mayor  que  la 
que  maximiza  el  beneficio  del  monopolista,  ocurriendo  obviamente  lo  contrario  con  el 
precio. 


► Ejercicio  3.5.1 

Considere  un  mercado  abastecido  por  dos  únicas  empresas.  Ay  B,  en  el  que  se  dan  las 
siguientes  condiciones  de  demanda  y de  costes: 

D : p=  26  - X 

C:  CTi(xj)  = 2x¡,  para  i — A,B. 

1.  Suponga  que  ambas  empresas  han  de  decidir  simultáneamente  la  cantidad  que 
sacan  al  mercado  y determine  la  solución  de  Cournot-Nash. 

2.  Responda  a las  preguntas  de  los  dos  apartados  anteriores  para  el  caso  en  que  en  el 
mercado  participan  tres  empresas  idénticas,  A,B  y C,  en  lugar  de  dos. 


► Ejercicio  3.5.2  Modelo 

Determine  el  equilibrio  de  Nash  para  el  modelo  de  duopolio  de  Cournot  visto  anterior- 
mente, pero  bajo  el  supuesto  de  que  las  empresas  tienen  costes  de  producción  unitarios 
distintos: 

CTi(xi)  = c\X\)  CT2(x2)  = c2x2;  c2  > c\. 


► Ejercicio  3.5.3 

Suponga  que  cada  una  de  las  empresas  además  del  coste  unitario  de  producción  c tiene 
un  coste  adicional  por  unidad  asociado  al  transporte,  el  almacenaje,  un  impuesto  ...  En 
este  caso  la  función  de  costes  totales  sería  de  la  forma  CT¿(x¿)  = cx¿,  donde  c = c + t es 
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3.5.3.  Generalización  a n empresas 


el  coste  unitario  generalizado.  Se  pide: 

1.  Determine  el  equilibrio  de  Cournot-Nash 

2.  Suponga  que  se  produce  una  variación  en  t y determine  que  proporción  de  dicha 
variación  se  trasladará  al  precio  de  mercado. 


3.5.3  Generalización  a n empresas 

El  modelo  anterior  se  extiende  fácilmente  al  caso  en  que  existe  un  número  indeterminado 
de  empresas  n.  Seguimos  suponiendo  que  las  condiciones  de  costes  de  cada  una  de  las  em- 
presas quedan  recogidas  por  la  función: 

C¡(xj)  = cxi  i = 1, . . . , n.  (3.13) 

Esto  es,  todas  las  empresas  son  capaces  de  producir  a un  coste  unitario  de  c um  con  inde- 
pendencia del  volumen  de  producción  que  elijan. 

El  precio  del  producto  quedará  ahora  determinado  por  la  cantidad  sacada  entre  las  n em- 
presas y la  disposición  a pagar  de  los  consumidores,  estando  recogida  esta  última  a través 
de  la  siguiente  función  (inversa)  de  demanda: 

n 

p = a — bX,  X = *¿.  (3.14) 

i= 1 


Representación  en  forma  normal 

■ / = {1,-  • • ,«}. 

■ S,  = { Xj  : Xi  > 0},  para  i = 1,  • • • , n. 

■ 7Zí(xí,X-í ) = Xj[a  — b(xi  + £ Xj)  - c\,  para  i = 1,  • • • ,n. 

Determinación  del  equilibrio  de  Nash 

Funciones  de  mejor  respuesta  B¿(x_¿)  Cada  empresa  tiene  que  decidir  la  cantidad  de  pro- 
ducto que  saca  al  mercado  sin  conocer  que  cantidad  sacarán  las  demás.  Podemos  plantear 
su  problema  de  decisión  como: 

máx  TCi(xi,Y^Xj)  = máx xl [a  — b(xi  + Y^xj))  ~ c\-  (3.15) 

x¡  Xi  m 
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Dado  que  la  función  objetivo  es  cóncava,  la  condición  de  primer  orden  de  este  programa 
será  a la  vez  necesaria  y suficiente: 


d ti  i 
dxi 


(**/E  xí) 


= a — 2b x*  - b Xj  — c = 0. 
Í& 


Como  podemos  apreciar,  dicha  condición  no  nos  dará  una  única  cantidad  óptima,  sino  una 
distinta  para  cada  posible  cantidad  sacada  al  mercado  por  el  resto  de  empresas  £ x¡.  Se 

trata,  pues,  de  una  función  de  mejor  respuesta,  la  cual  podemos  hacer  explícita  sin  más  que 
despejar  x* : 


X ; 


Cl  C 1 r — i 

IT -2  5^- 


(3.16) 


Equilibrio  de  Nash  El  equilibrio  de  Nash  del  juego  vendrá  dado  por  el  vector  de  canti- 
dades (fi,  • • • , xn)  que  sean  simultáneamente  mejor  respuesta  para  todas  las  empresas,  esto 
es,  el  vector  de  cantidades  que  satisface  el  siguiente  sistema  de  n ecuaciones: 


x¡ 


a — c 
2b 


para  i = 1,  ■ • • ,n. 


(3.17) 


Resolviendo  el  sistema  anterior  obtenemos  como  único  equilibrio  de  Nash: 


x¡ 


1 a — c 
n + 1 b 


V¿ 


Valoración  de  los  resultados  de  equilibrio 

La  cantidad  total  sacada  al  mercado  en  el  equilibrio  de  Nash  es 


X n x i 

vaciándose  el  mercado  para  un  precio 

n a — c 


n a — c 
n + 1 b 


V = 


a — b 


n + 1 b 


a + nc  a — c 

= c + 


n + l 


n + 1 


Por  tanto,  en  el  equilibrio  los  beneficios  de  cada  empresa  vendrán  dados  por: 


TCi(XirXj)  = 


1 a — c 
n + l b 


a — c 
n + l 


+ — c) 


(n  + 1): 


Podemos  comprobar  que  a medida  que  aumenta  el  número  de  empresas  la  cantidad  total 
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3.5.3.  Generalización  a n empresas 


sacada  al  mercado  aumenta  y tiende  a la  que  se  sacaría  bajo  las  condiciones  de  competencia 
perfecta.  De  hecho,  se  cumple  que  lím  X = De  la  misma  manera  a medida  que  aumen- 
ta el  número  de  empresas  el  precio  tiende  al  coste  unitario  de  producción  y los  beneficios 
extraordinarios  tienden  a desaparecer. 


► Ejercicio  3.5.4 

Considere  que  el  modelo  anterior  de  oligopolio  de  Cournot  con  n empresas  y analice  los 
efectos  sobre  la  situación  de  equilibrio  del  establecimiento  de  un  impuesto  de  t um  por 
unidad  producida.  En  particular,  demuestre  que  la  repercusión  de  dicho  impuesto  sobre 
el  precio  de  equilibrio  será  tanto  mayor  cuanto  mayor  sea  n. 
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3.6  Aplicación  II:  El  modelo  de  oligopolio  de  Bertrand 

3.6.1  Introducción 

En  el  modelo  de  Cournot  las  empresas  elegían  la  cantidad  que  deseaban  sacar  al  mercado, 
determinándose  en  éste  el  precio  de  venta.  En  1883  Bertrand  propuso  un  modelo  alterna- 
tivo en  el  que  cada  empresa  elige  el  precio,  produciendo  a continuación  la  cantidad  que  le 
demanden  al  mismo. 

3.6.2  Un  modelo  básico 

Consideremos  una  situación  en  la  cual  el  mercado  de  determinado  bien  es  abastecido  por 
dos  únicas  empresas.  Ay  B.  Los  costes  para  la  empresa  i de  poner  en  el  mercado  una  deter- 
minada cantidad  del  bien  x¡  vienen  dados  por  una  fución  C,(x¡)  que  vamos  a suponer  lineal 
e idéntica  para  ambas  empresas: 


(3.18) 


cx¡  para  i = A,B. 


La  relación  que  guarda  la  cantidad  total  que  desearán  comprar  los  consumidores  con  el 
precio  viene  dada  por: 


Xjj  = a — bp  donde  p = mín{p^,  pg}. 


(3.19) 


Suponemos,  además,  que  en  el  caso  de  que  las  dos  empresas  fijen  el  mismo  precio,  se  repar- 
tirán las  ventas  a partes  iguales. 

Representación  en  forma  normal 
Jugadores  / = {A,B}. 

Estrategias  S¡  = {p¡  : p¡  > 0}  para  i = A,B. 

Funciones  de  pagos 


/ 


0 


si  pj  < pi 


ni(PúPj)  - Sjip  - c)(a -bp)  si  pi  = pj  = p 

SPi~c)(a  ~bPi)  si  P;  > Pi- 


para i = A,  B,  i 7^  j. 
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3.6.2.  Un  modelo  básico 


Determinación  del  equilibrio  de  Nash 


En  el  modelo  de  Cournot  obteníamos  la  función  de  mejor  respuesta  de  cada  empresa  a partir 
de  las  condiciones  de  primer  orden,  esto  es,  de  la  diferenciación  de  la  función  de  beneficios. 
En  este  caso  nos  encontramos,  sin  embargo,  con  que  la  función  de  beneficios  es  discontinua, 
por  lo  que  no  podemos  recurrir  a diferenciarla  para  obtener  la  función  de  mejor  respuesta. 
Podemos,  sin  embargo,  proceder  de  una  manera  más  informal  y determinar  cual  sería  la 
mejor  respuesta  de  una  de  las  empresa  i en  función  del  precio  p¡  que  fije  su  rival. 

■ Consideremos  primero  que  ocurriría  si,  por  la  razón  que  fuese,  pj  < c.  En  este  caso  a 
la  empresa  i no  le  interesa  participar  en  el  mercado  ya  que  sólo  podría  hacerlo  a un 
precio  que  le  daría  pérdidas.  En  términos  del  modelo,  su  mejor  respuesta  sería  elegir 
cualquier  precio  p¡  que  cumpliese  p¿  > p¡,  por  ejemplo  p¡  = c. 

■ Para  p¡  > cía  empresa  puede  obtener  beneficios  positivos  fijando  un  precio  por  debajo 
del  de  su  rival.  Siempre  que  p¡  sea  inferior  al  precio  de  monopolio,  la  empresa  i podría 
quedarse  con  todo  el  mercado  fijando  un  precio  ligeramente  inferior,  digamos  p¡  — e. 
De  esta  manera  la  empresa  i conseguiría  unos  beneficios9: 

ni{pj  - e, p¡)  = [( pj  -s)-c][a-  b(pj  - e)] 


Hemos  condicionado  que  p¡  — e sea  la  mejor  respuesta  de  i a que  p¡  sea  inferior  al  precio 
de  monopolio  pm.  Es  suficiente  con  tener  en  cuenta  que  pm  es  el  precio  que  permitiría 
obtener  el  mayor  beneficio  del  mercado  a una  empresa  que  lo  controlase,  para  darse 
cuenta  que  si  pj  > pm  entonces  la  mejor  respuesta  de  i sería  fijar  p¡  = pm. 

■ Nos  queda  únicamente  por  determinar  cual  sería  la  mejor  respuesta  de  la  empresa  i 
en  el  caso  concreto  de  que  p¡  = c.  Dado  que  fijar  un  precio  p¡  < p¡  llevaría  a obtener 
pérdidas,  la  mejor  respuesta  será  fijar  p¡  > pj,  que  llevará  a la  empresa  a obtener  unos 
beneficios  nulos. 

La  revisión  exhaustiva  de  las  mejores  respuestas  para  todos  los  posibles  valores  de  pj  nos  ha 
permitido  determinar  la  siguiente  correspondencia  de  mejor  respuesta: 


9Siendo  rigurosos  con  el  planteamiento  formal  del  modelo,  no  existe  una  mejor  respuesta  por  parte  de  la 
empresa  z,  ya  que  la  maximización  de  beneficios  requiere  que  p¡  este  tan  próximo  a pj  como  sea  posible  (que  £ 
sea  tan  pequeño  como  sea  posible).  Nosotros  suponemos  que  existe  £ es  suficientemente  pequeño  como  para 
que  a la  empresa  i no  le  interese  acercarse  más  a p¡. 
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Hp¡) 


para  i = A,  B,  i ^ j. 


{pi  ■ Vi 

> Pj } 

si 

Pi  < c 

{pi  ■ Pl 

IV 

35 

si 

Pj  = C 

Pj-£ 

si 

C <pj  < V 

Pm 

si 

Pi  > Pm- 

(3.20) 


A partir  de  estas  funciones  de  mejor  respuesta  es  inmediato  comprobar  que  solo  existe  una 
combinación  de  estrategias  que  es  EN:  aquella  en  que  ambas  empresas  están  fijando  un 
precio  igual  al  coste  de  producción  p¡  = p¡  = c. 


► Ejercicio  3.6.1 

Represente  gráficamente  las  correspondencias  de  mejor  respuesta  del  modelo  anterior. 


El  hecho  de  que,  a pesar  de  existir  dos  únicas  empresas,  en  el  único  equilibrio  de  Nash  de 
este  modelo  se  alcance  un  resultado  eficiente,  hace  que  se  hable  de  la  la  paradoja  de  Bertrand. 
En  efecto,  el  atomismo  de  los  agentes  y su  comportamiento  precio-aceptante  como  origen  de 
la  competencia  y del  logro  de  la  eficiencia  en  los  mercados,  parecen  ser  puestos  en  entredi- 
cho por  este  modelo:  incluso  en  un  mercado  con  dos  únicas  empresas,  si  éstas  compitiesen 
«á  la  Bertrand»  se  alcanzarían  los  mismos  resultados  que  en  el  equilibrio  competitivo  de 
largo  plazo.  Sin  embargo,  esta  aparente  paradoja  se  debe  más  bien  a la  falta  de  realismo  del 
modelo  de  Bertrand  que  hemos  analizado.  La  competencia  en  precios  en  el  mundo  real  se 
da  en  un  marco  estratégico  muy  diferente  del  que  hemos  analizado,  en  el  cual  las  empresas 
tienen  que  decidir  de  forma  simultánea  y sabiendo  que  no  se  van  a volver  a encontrar  en  el 
futuro.  Esa  falta  de  realismo  del  marco  estratégico,  también  se  extiende  a las  condiciones  de 
demanda  y de  costes.  Por  el  lado  de  la  demanda,  lo  habitual  es  que  exista  un  cierto  grado 
de  diferenciación  del  producto,  lo  que  confiere  a cada  empresa  un  cierto  grado  de  poder  de 
mercado.  Por  el  lado  de  los  costes,  una  extensión  lógica  es  considerar  que  ocurriría  si  las 
empresas  tuviesen  una  capacidad  limitada,  cuestión  que  se  aborda  en  otro  modelo  clásico 
de  oligopolio,  el  de  Edgeworth.  En  definitiva,  la  principal  utilidad  del  modelo  de  Bertrand 
que  acabamos  de  ver,  es  su  uso  como  referencia  para  la  elaboración  de  otro  modelos  más 
realistas  a la  hora  de  recoger  el  marco  estratégico  y las  condiciones  de  demanda  y de  costes 
a las  que  se  enfrentan  las  empresas  en  un  oligopolio. 


► Ejercido  3.6.2  Modelo  de  Bertrand  con  producto  diferenciado 
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3.6.2.  Un  modelo  básico 


Considere  una  situación  de  duopolio  en  el  que  las  empresas  eligen  el  precio  de  su  pro- 
ducto bajo  las  siguientes  condiciones  de  demanda  y de  costes: 

D : xdi  = c¿-  fipi  + Spj  ot,  f>,  7 > 0.  i,j  = 1, 2,  i £ ). 

C : CTi(x¡ ) = ex  i,  para  i = 172. 

■ Represente  la  situación  anterior  como  un  juego  en  forma  estratégica 

■ Determine  las  funciones  de  mejor  respuesta  de  cada  empresa  y represéntelas  grá- 
ficamente. 

■ Determine  el  equilibrio  de  Nash  del  juego. 
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3.7  La  sobreutilización  de  los  recursos  públicos:  el  problema  de  los  ejidos 

Gibbons  págs.  27-29. 
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3.8.  Ejercicios 


3.8  Ejercicios 


► Ejercicio  3.8.1 

Determine  los  equilibrios  de  Nash  del  siguiente  juego: 


511 

512 

513 


Slll  SII2  SII3 


3,7 

1,5 

5,5 

4,4 

1,1 

2,6 

2,2 

4,6 

3,4 

Figura  3.13 


► Ejercicio  3.8.2 

Determine  el  equilibrio  de  Nash  del  siguiente  juego  en  forma  extensiva. 
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► Ejercicio  3.8.3 

A dos  individuos  se  les  ofrece  la  posibilidad  de  repartirse  100  um  de  acuerdo  con  el 
siguiente  procedimiento.  Cada  uno  de  ellos  tiene  que  solicitar  de  manera  simultánea 
que  proporción  de  esa  cantidad  pide  para  si  mismo.  Si  las  peticiones  de  los  jugadores  son 
compatibles  se  lleva  a cabo  el  reparto,  en  caso  contrario  ninguno  de  los  dos  recibe  nada. 
Construya  las  funciones  de  mejor  respuesta  de  cada  jugador,  represéntelas  gráficamente 
y determine  el/los  equilibrios  de  Nash  del  juego. 


► Ejercicio  3.8.4 

Determine  todos  los  equilibrios  de  Nash  del  juego  del  ejercicio  la  paradoja  del  presidente. 


► Ejercicio  3.8.5 

Dos  individuos  disponen  de  una  cantidad  de  120  unidades  de  un  bien  X para  consumir 
entre  ambos  a lo  largo  de  dos  periodos  («hoy»  y «mañana»).  Cada  uno  de  ellos  ha  de 
decidir  de  manera  simultánea  cuanto  consume  «hoy».  En  el  caso  de  que  la  decisión 
de  ambos  sea  compatible  se  lleva  a cabo,  y si  entre  ambos  piden  más  de  la  cantidad 
disponible  se  reparten  dicha  cantidad  a partes  iguales.  Si  no  agotan  en  el  primer  periodo 
las  120  unidades  disponibles,  en  el  periodo  2 se  les  da  la  mitad  de  lo  que  queda  a cada 
uno.  Las  preferencias  de  los  jugadores  en  relación  con  el  consumo  presente  (x^)  y el 
consumo  futuro  (xl2)  vienen  dadas  por  la  función: 

Ui(x\,  xl2)  = x\xl2  ; i = 1,2. 

Determine  la  representación  en  forma  estratégica  del  juego  y el  equilibrio  de  Nash  del 
mismo.  Comente  a continuación  los  resultados,  valorándolos  en  términos  de  eficiencia. 


► Ejercicio  3.8.6 

Considere  los  viajes  por  carretera  en  automóvil  privado  entre  dos  ciudades.  Ay  B.  Su- 
ponga que  habitualmente  se  produce  un  desplazamiento  de  1.000  personas  en  una  de- 
terminada franja  horaria  desde  A hacia  B y que  existen  dos  alternativas: 

■ la  ruta  Y,  la  cual  no  tiene  problemas  de  capacidad,  y por  la  que  se  tarda  dos  horas 
en  llegar; 

■ la  ruta  Z,  por  la  cual  se  puede  llegar  en  una  hora  y media,  pero  sólo  si  el  número  de 
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vehículos  que  la  utiliza  durante  esa  franja  horaria  es  inferior  a 500.  En  caso  de  que 
la  utilicen  más  vehículos  se  produce  congestión  y la  duración  del  desplazamiento 
viene  dada  por  la  expresión  = 90  + .003(n  — 500)2,  donde  n es  el  número  de 
vehículos  que  elige  dicha  ruta. 

1.  ¿Cuántas  personas  eligen  la  ruta  Z en  el  equilibrio  de  Nash  de  esta  situación  de 
interdependencia  estratégica? 

2.  ¿Cuál  es  el  número  óptimo  de  vehículos  que  debería  ir  por  cada  ruta  desde  el 
punto  de  vista  social  bajo  el  supuesto  de  que  el  objetivo  es  minimizar  el  tiempo 
total  empleado? 


► Ejercicio  3.8.7 

Dos  socios,  1 y 2 participan  en  un  determinado  proyecto.  Ambos  acuerdan  repartirse  a 
medias  el  rendimiento  que  obtengan  de  dicho  proyecto,  el  cual  depende  del  esfuerzo 
de  cada  uno  de  ellos:  R(e  1,^2)  = 4(ei  + ez  + oce^),  donde  es  el  nivel  de  esfuerzo 
realizado  por  el  socio  i.  Suponga  que  £ [0,4]  y que  c £ [0,  \].  El  coste  para  cada  socio 
del  nivel  de  esfuerzo  que  realice  viene  dado  por:  C¡(e¿)  = ef;  i = 1,2.  Suponga  que  es 
conocimiento  común  que  cada  socio  elige  el  nivel  de  esfuerzo  de  manera  simultánea  y 
que  el  objetivo  de  ambos  es  maximizar  el  beneficio  neto  que  obtienen.  Se  pide: 

1.  Interprete  el  significado  del  parámetro  oí. 

2.  Determine  el  nivel  de  esfuerzo  que  ejercerá  cada  uno  de  los  agentes  en  el  equilibrio 
de  Nash. 

3.  Comente  los  resultados. 


► Ejercicio  3.8.8 

Considere  una  situación  en  la  cual  dos  empresas  se  dedican  a la  explotación  de  los  re- 
cursos pesqueros  de  un  único  lago.  El  volumen  de  capturas  obtenido  por  ambas  em- 
presas durante  un  determinado  periodo  de  tiempo  depende  del  número  de  horas  que 
han  dedicado  ambas  empresas  a la  pesca  de  acuerdo  con  la  siguiente  función:  C = 
H — bH2,  b > 0,  donde  C y H recogen,  respectivamente,  el  volumen  de  capturas  y el 
número  de  horas  totales(C  = C\  + C2;  H = H¡  + H2).  Suponiendo  que  el  volumen  de 
capturas  para  una  empresa  guarda  una  proporción  directa  con  su  esfuerzo  relativo,  esto 
es:  Q = (h^!h.)C;  ( i,j  = 1,2;  i j ) y que  el  precio  unitario  de  venta  y el  coste  de 
la  hora  de  esfuerzo  son  de  p y vo  unidades  monetarias  respectivamente,  se  pide: 
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1.  Determinar  el  equilibrio  de  Nash  bajo  el  supuesto  de  que  ambas  empresas  han  de 
decidir  de  forma  simultánea  el  número  de  horas  que  van  a dedicar  a la  captura  de 
pescado. 

2.  Comentar  detenidamente  los  resultados  de  equilibrio. 


► Ejercicio  3.8.9 

Para  el  juego  de  la  figura  adjunta: 

1.  determine  el  conjunto  de  estrategias  racionalizadles  para  cada  jugador; 

2.  determine  los  equilibrios  de  Nash  que  tiene; 

3.  utilícelo  para  explicar  la  relación  entre  estrategias  racionalizadles  y equilibrio  de 
Nash. 


sin 

SlI2 

SlI3 

Sil 

9,3 

4,8 

2,10 

SI2 

2,10 

4,8 

9,3 

SI3 

7,5 

5,6 

7,5 

Figura  3.15 


► Ejercicio  3.8.10 

Determine  el  equilibrio  de  Nash  en  mixtas  del  siguiente  juego. 
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a 

P 

7 

a 

3,2 

2,1 

1,3 

b 

2,1 

1,5 

0,3 

c 

1/3 

4,2 

2,2 

Figura  3.16 


► Ejercicio  3.8.11 

Dos  agentes  económicos  ( I y II),  han  de  decidir  de  manera  simultánea  si  participan  o 
no  en  un  determinado  proyecto.  La  colaboración  en  el  mismo  supone  un  coste  Q para 
el  agente  i.  Si  al  menos  uno  de  ellos  asume  dicho  coste  cada  uno  de  ellos  recibirá  un 
excedente  E¡.  En  el  caso  de  que  ninguno  de  los  dos  decida  incurrir  en  el  coste  de  la  apor- 
tación el  excedente  a repartir  será  nulo.  Modelice  la  situación  anterior  como  un  juego 
y determine,  el/los  equilibrios  de  Nash  (tanto  en  estrategias  puras  como  en  mixtas)  en 
función  del  valor  de  los  parámetros.  [Nota:  Considere  E¿,  Q > 0,  i=l,2] 


► Ejercicio  3.8.12 

Dos  agentes  económicos.  Ay  B han  de  decidir  de  manera  simultánea  su  actitud  ante  el 
reparto  de  un  determinado  bien.  En  concreto,  cada  uno  de  los  agentes  puede  adoptar 
una  actitud  "agresiva"  o una  actitud  "pacífica".  Denote  la  valoración  en  unidades  mo- 
netarias que  hace  del  bien  cada  agente  por  V¿,  i = A,  B,  y suponga  que  los  pagos  que 
recibirá  en  función  de  la  actitud  del  otro  serán: 

- Si  los  dos  adoptan  una  actitud  "pacífica"  recibirá  cada  uno  de  ellos  la  mitad  de 
bien,  valorándolo  en  \ V¿. 

- Si  i adopta  una  adopta  una  actitud  "pacífica"  y j una  actitud  "agresiva"  éste  último 
se  queda  la  totalidad  del  bien  manteniéndose  i en  su  situación  de  partida. 

- Si  los  dos  adoptan  una  actitud  "agresiva"  se  llevará  cada  uno  la  mitad  del  bien 
pero  les  supondrá  un  coste  de  Q um. 
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3 Juegos  estáticos  (II) 


Determine  todos  los  equilibrios  de  Nash,  tanto  en  estrategias  puras  como  en  mix- 
tas, en  función  del  valor  de  los  parámetros  V¡  y C¡.  Comente  detenidamente  los 
resultados. 


► Ejercicio  3.8.13 

Dado  el  siguiente  juego  en  su  forma  normal,  determine  todos  los  equilibrios  de  Nash, 
tanto  en  estrategias  puras  como  en  mixtas,  en  función  del  valor  de  los  parámetros  (su- 
ponga que  todos  ellos  son  positivos  y distintos  entre  sí). 


511 

512 


Sin  SII2 


a,  2 

4 ,m 

0,4 

Figura  3.17 


► Ejercicio  3.8.14 

Un  determinado  fin  de  semana  A.G.y  G.A.  se  desplazaron  de  Madrid  a Santander  con  la 
idea  de  disfrutar  de  un  merecido  descanso.  El  sábado  a la  noche  tuvieron  una  discusión 
y cada  uno  se  fue  por  su  lado.  El  domingo  ambos  tienen  que  sacar  su  billete  de  vuelta 
para  Madrid  y cada  uno  de  ellos  sabe  que  el  otro  tiene  que  volver  a primera  hora  de 
la  mañana  del  lunes  y que  sólo  pueden  hacerlo  en  el  tren  o en  el  autobús,  cuya  hora  de 
salida  es  en  ambos  casos  a las  8 de  la  mañana.  Plantee,  de  la  manera  más  general  posible, 
un  juego  en  forma  estratégica  que  refleje  cada  una  de  las  posibles  situaciones  siguientes: 

A.  A.G.  desea  por  encima  de  todo  no  encontrarse  con  G.A.,  si  bien  es  cierto  que  siem- 
pre ha  preferido  viajar  en  autobús.  Por  el  contrario,  G.A.  desea  por  encima  de  todo 
coincidir  en  el  viaje,  si  bien  es  cierto  que  siempre  ha  preferido  viajar  en  tren  (Su- 
ponga que,  por  experiencias  pasadas,  las  preferencias  de  cada  uno  de  ellos  son 
conocimiento  común). 

B.  Tanto  A.G.  como  G.A.  desean  por  encima  de  todo  coincidir  en  el  viaje  con  el  fin  de 
reconciliarse  aunque  A.G.  siempre  ha  preferido  viajar  en  autobús  y G.A.  en  tren 
(Suponga  de  nuevo  que  las  preferencias  de  cada  uno  de  ellos  son  conocimiento 
común). 
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3.8.  Ejercicios 


Se  pide: 

1.  Determine  el/los  equilibrios  de  Nash  tanto  en  estrategias  puras  como  en  mixtas  y 
utilice  las  correspondencias  de  mejor  respuesta  para  presentarlos  gráficamente. 

2.  Comente  como  influye  el  valor  de  los  parámetros  que  recogen  las  ganancias  en  las 
estrategias  mixtas  de  equilibrio  de  cada  uno  de  los  juegos. 

3.  ¿Tiene  alguno  de  los  jugadores  interés  en  mover  primero  en  el  caso  inicial?,  ? y en 
el  segundo? 


► Ejercicio  3.8.15  Competencia  en  precios  en  una  ciudad  lineal 

Considere  una  ciudad  lineal,  cuya  longitud  se  puede  normalizar  a la  unidad,  y suponga 
que  los  N consumidores  de  un  bien  X se  encuentran  uniformemente  distribuidos  a lo 
largo  de  la  misma.  Dicho  bien  es  ofrecido  en  la  ciudad  por  dos  empresas,  I y II,  las 
cuales  se  encuentran  situadas  en  los  extremos  de  la  ciudad  y que  pueden  producir  las 
cantidades  que  deseen  a un  coste  unitario  de  c um  [CT¿(x¿)  = cxp,  i = I,  II], 

Dichas  empresas  compiten  entre  sí  á la  Bertrand  (eligen  el  precio  de  manera  simultánea). 
Los  consumidores  deciden  si  compran  o no  una  única  unidad  del  bien  y,  en  caso  de 
comprar,  a qué  empresa  lo  hacen.  Su  decisión  de  compra  esta  basada  en  el  precio  gene- 
ralizado ps  que  incluye  el  precio  fijado  por  las  empresas  más  el  coste  de  transporte,  el 
cuál  suponemos  que  es  de  t um  por  unidad  de  distancia  recorrida. 

Representa  la  situación  anterior  como  un  juego  en  forma  estratégica  y determine  todos 
los  equilibrios  de  Nash  del  mismo  bajo  el  supuesto  de  que  el  precio  de  reserva  de  los 
consumidores  cumple  la  condición: pr  > c + 3t. 


► Ejercicio  3.8.16 

En  un  experimento  sobre  el  comportamiento  social  de  los  cerdos  se  encierran  en  un  mis- 
mo compartimento  un  cerdo  dominante  (D)  y un  cerdo  sumiso  (S).  En  un  extremo  del 
compartimento  se  sitúa  una  palanca  que  al  ser  pulsada  por  uno  de  los  animales  hace  que 
se  deposite  una  cierta  cantidad  de  comida  en  una  pila  situada  en  el  otro  extremo.  Pulsar 
el  botón  supone  un  esfuerzo  para  los  animales  y el  reparto  de  la  comida  depende  de  cuál 
sea  el  animal  que  pulsa  el  botón  (de  cuál  llega  primero  a la  pila).  Si  pulsa  S,  entonces  D 
se  come  todo  antes  que  consiga  llegar  S;  si  pulsa  D entonces  S consigue  comer  una  parte 
de  la  ración  antes  de  que  llegue  D;  por  último  si  los  dos  van  a pulsar  llegarán  a la  vez 
comiéndose  D la  mayor  parte.  Se  pide: 
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3 Juegos  estáticos  (II) 


1.  Haga  la  representación  en  forma  normal  de  esta  situación  de  interdependencia 
estratégica. 

2.  Trate  de  anticipar  cual  será  el  desarrollo  del  juego  (la  solución)  y explique  que 
supuestos  hace  para  realizar  dicha  predicción. 


► Ejercicio  3.8.17 

Un  grupo  de  N personas  es  testigo  de  un  delito.  Cada  una  de  dichas  personas  ha  de 
decidir  de  manera  simultánea  si  avisar  (A)  o no  avisar  (A)  a la  policía.  Suponga  que 
cada  una  de  ellas  asigna  un  valor  v a que  la  policía  reciba  la  información  y un  coste  c a 
realizar  el  aviso  con  v > c. 

1.  Haga  la  representación  en  forma  estratégica  de  la  situación  anterior. 

2.  Ponga  un  ejemplo  de  una  combinación  de  estrategias  puras  que  sería  un  equilibrio 
de  Nash. 

3.  Encuentre  el  equilibrio  de  Nash  en  estrategias  mixtas  (simétrico)  en  el  que  cada 
individuo  avisa  con  probabilidad  p.  ¿Qué  sucede  con  p a medida  que  el  número 
de  personas  que  ha  presenciado  el  crimen,  N,  aumenta? 
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5 Juegos  dinámicos  con  información  incompleta 


A los  juegos  con  información  incompleta  también  se  les  denomina  juegos  bayesianos. 

• En  un  juego  con  información  completa  las  funciones  de  ganancias  de  los  jugadores 
son  de  dominio  público. 

• En  los  juegos  con  información  incompleta  al  menos  un  jugador  no  está  seguro  de  la 
función  de  ganancias  de  otro  jugador. 

• En  este  tipo  de  juegos  también  se  distingue  entre  juegos  estáticos  y juegos 
dinámicos,  aunque  la  mayoría  de  los  juegos  bayesianos  con  interés  económico  son 
dinámicos. 


5.1  Juegos  de  Señalización 

5.1.A  Equilibrio  bayesiano  perfecto  en  juegos  de  señalización 

Un  juego  de  señalización  es  un  juego  dinámico  con  información  incompleta  y dos 
jugadores: 

E:  emisor 

R:  receptor 

El  desarrollo  del  juego  es  el  siguiente: 

1.  El  azar  escoge  un  tipo  t¡  del  conjunto  de  tipos  factibles  T=¡tu...,  tj  que  asigna  al  siguiente 
emisor  según  una  distribución  de  probabilidad  p(t¡),  donde  p(t¡)>0  para  cada  i y 
p(f1)+...+p(fí)=l. 

2.  El  emisor  observa  t¡  y elige  un  mensaje  m¡  del  conjunto  de  mensajes  factibles 
M={mlr...rm.j}. 

3.  El  receptor  observa  m¡  (pero  no  tj)  y elige  a continuación  una  acción  ak  de  un  conjunto  de 
acciones  factibles  A={alr. . .,aK}. 

4.  Las  ganancias  vienen  dadas  por  LI,(tt,  m¡,  ak)  y UR(t¡,  mjr  ak) 
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5 Juegos  dinámicos  con  información  incompleta 


Aplicaciones 

• Modelo  de  señalización  del  mercado  de  trabajo  de  Spencer  (1973) 

- Emisor  > Trabajador 

- Receptor  > Mercado  de  posibles  empresarios 

- Tipo  > Capacidad  productiva  del  trabajador 

- Mensaje  > Nivel  de  educación 

- Acción  > Salario 


• Modelo  de  inversión  empresarial  y estructura  de  capital  de  Myers  y Majluf  (1984) 

- Emisor  > Empresa  que  necesita  capital  para  financiar  un  proyecto 

- Receptor  > Inversión  potencial 

- Tipo  > Rentabilidad  de  los  activos  existentes  en  la  empresa 

- Mensaje  > Oferta  de  participación  en  el  beneficio  de  la  empresa  a cambio  de  la 
financiación 

- Acción  > Decisión  de  si  invertir  o no  por  parte  del  inversor 


Esquema  de  Juego  de  Señalización 


Emisor 


Estrategia 
pura  del 
receptor 

a(m¡) 


Estrategia  pura  del 
emisor  m(t¡) 
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5 Juegos  dinámicos  con  información  incompleta 


• Recordemos  que  en  cualquier  juego  la  estrategia  de  un  jugador  es  un  plan  completo  de 
acción. 

- En  un  juego  de  señalización,  una  estrategia  pura  del  emisor  es  una  función  m(t,)  que 
especificará  el  mensaje  que  elegirá  cada  tipo  que  el  azar  pueda  determinar,  y una 
estrategia  del  receptor  es  una  función  a(rrij)  que  especifica  que  acción  elegirá  ante  cada 
mensaje  del  emisor. 


ESTRATEGIAS  DEL  EMISOR 

• ESTRATEGIA  1 DEL  EMISOR:  Jugar  si  el  azar  determina  q y 

• ESTRATEGIA  2 DEL  EMISOR:  Jugar  si  el  azar  determina  q y 

• ESTRATEGIA  3 DEL  EMISOR:  Jugar  m2  si  el  azar  determina  q y 

• ESTRATEGIA  4 DEL  EMISOR:  Jugar  m2  si  el  azar  determina  q y 


ESTRATEGIAS  DEL  RECEPTOR 

• ESTRATEGIA  1 DEL  RECEPTOR  : Jugar  a1  si  el 

• ESTRATEGIA  2 DEL  RECEPTOR  : Jugar  a2  si  el 

• ESTRATEGIA  3 DEL  RECEPTOR  : Jugar  a2  si  el 

• ESTRATEGIA  4 DEL  RECEPTOR  : Jugar  a2  si  el 


m2  si  el  azar  determina  t2. 
m2  si  el  azar  determina  t2. 
m2  si  el  azar  determina  t2. 
m2  si  el  azar  determina  t2. 

emisor  elige  iru  y a2  si  el  emisor  elige  m2. 
emisor  elige  ruj  y a2  si  el  emisor  elige  m2. 
emisor  elige  m,  y a2  si  el  emisor  elige  m2. 
emisor  elige  ruj  y a2  si  el  emisor  elige  m2. 


• El  emisor  conoce  la  historia  completa  del  juego  cuando  elige  un  mensaje,  esta  elección  se 
da  en  un  conjunto  de  información  con  un  único  nodo. 

• Por  el  contrario,  el  receptor  elige  una  acción  después  de  observar  el  mensaje  del  emisor 
pero  sin  conocer  el  tipo  de  éste,  por  lo  que  la  elección  del  receptor  se  da  en  un  conjunto  de 
información  con  más  de  un  elemento. 
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5 Juegos  dinámicos  con  información  incompleta 


- Requisito  1 de  señalización.  Después  de  observar  cualquier  mensaje  m¡  de  M,  el  receptor  debe 
formarse  una  conjetura  sobre  qué  tipos  podrían  haber  enviado  m¡.  Denotemos  esta  conjetura  con  la 
distribución  de  probabilidad  ¡i(t¿  I mf>0  para  cada  t¡  en  T y 

Z ¿¿ir,  I ntj)=  i 

t^T 


Dados  el  mensaje  del  emisor  y la  conjetura  del  receptor,  la  acción  óptima  del  receptor  será: 

- Requisito  2R  de  señalización:  Para  cada  mj  en  M,  la  acción  del  receptor  a*(ni)  debe  maximizar 
la  utilidad  esperada  del  receptor  dada  la  conjetura  y(t¡  I m¡)  sobre  qué  tipos  podrían  haber  enviado 
nij. 

Es  decir,  a*(m¡)  es  una  solución  de 

m3X  Z Áf¡  1 miPr  {t, >»'/  ) 

ak  6 A á~ 

* t¡eT 

En  el  caso  del  emisor,  sólo  se  requiere  que  su  estrategia  sea  óptima  dada  la  estrategia  del 
receptor,  ya  que  éste  tiene  la  información  completa  del  juego,  por  lo  tanto  en  su  caso  el 
requisito  de  señalización  será: 

- Requisito  2E  de  señalización:  Para  cada  t,  en  T,  el  mensaje  del  emisor  m*(t¡)  debe  maximizar  la 
utilidad  del  emisor  dada  la  estrategia  del  receptor  a*(m¡).  Es  decir,  m*(t,)  es  una  solución  de 

max  U E (/, , m . , a * ( m . ) ) 

nij&M  J ' 


Para  los  mensajes  en  la  trayectoria  de  equilibrio,  las  conjeturas  del  receptor  deberán 
cumplir  el  siguiente  requisito: 

- Requisito  3 de  señalización:  Para  cada  m¡  en  M,  si  existe  t,  en  T tal  que  m*(tj)=mjr  la  conjetura 
del  receptor  debe  derivarse  de  la  regla  de  Payes  y la  estrategia  del  emisor: 


P (r,  ) 


Z pOD 
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5 Juegos  dinámicos  con  información  incompleta 


Esquema  de  juego  de  señalización  con  ganancias 


5.1. B Refinamiento  del  equilibrio  bayesiano  perfecto  en  juegos  de  señalización 

Esquema  de  juego  de  señalización  con  ganancias 


Las  estrategias  y sistema  de  conjeturas  que  constituyen  equilibrio  bayesiano  perfecto  en  el 
juego  de  señalización  anterior  son: 

- [(I,I),(a,b),p=0.5,q]  para  cualquier  q>l/2 


- [(I,D),(a,a),p=l,q=0] 
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5 Juegos  dinámicos  con  información  incompleta 


Pero  en  este  juego  no  tiene  sentido  que  el  tipo  1 elija  D.  Formalmente  las  estrategias  del 
emisor  (D,I)  y (D,D)  (es  decir,  las  estrategias  en  las  que  el  tipo  1 elije  D)  están  estrictamente 
dominadas  a partir  del  conjunto  de  información  del  emisor  correspondiente  al  tipo  1. 

• Definición:  En  un  juego  de  señalización,  el  mensaje  m,  de  M está  dominado  para  el  tipo 
t¡  de  T si  existe  otro  nif  de  M tal  que  la  menor  ganancia  posible  de  t¡  por  utilizar  m¡  es  más 
alta  que  la  mayor  ganancia  posible  de  t¡  por  utilizar  m, 

• Por  lo  tanto,  se  debería  asignar  a q una  probabilidad  cero. 

Requisito  4 de  señalización:  Si  el  conjunto  de  información  que  sigue  a m¡  está  fuera  de  la 
trayectoria  de  equilibrio  y m¡  está  dominado  para  el  tipo  t¡,  entonces  (si  es  posible)  la  conjetura  del 
receptor  y(t¡  I m¡)  debería  asignar  probabilidad  cero  al  tipo  t¡.  (Esto  es  posible  siempre  que  m¡  no  esté 
dominado  para  todos  los  tipos  en  T). 

En  algunos  juegos,  existen  equilibrios  bayesianos  perfectos  que  cumplen  este  último 
requisito  pero  aún  así  parecen  poco  razonables. 

• Una  de  la  áreas  de  investigación  más  activa  de  la  Teoría  de  Juegos  se  ha  preocupado  de 
las  dos  siguientes  cuestiones: 

- Cuándo  un  equilibrio  bayesiano  perfecto  es  poco  razonable 

- Qué  requisito  adicional  puede  añadirse  a la  definición  de  equilibrio  para  eliminar  estos 
equilibrios  bayesianos  perfectos  que  no  son  razonables. 

• Chop  y Kreps  (1987)  hicieron  una  aportación  original  y muy  influyente  en  esta  área. 
Juego  de  señalización  cerveza  y quiche 
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5 Juegos  dinámicos  con  información  incompleta 


Las  estrategias  y sistema  de  conjeturas  que  constituyen  equilibrio  bayesiano  perfecto  en  el 
juego  de  señalización  anterior  son: 

- [(Quiche, Quiche), (no, duelo), p=0.1,q]  para  cualquier  q>l/2 

- [(Cerveza, Cerveza), (duelo, no  ),p,q=0.1[  para  cualquier  p>l/2 


• Estos  equilibrios  satisfacen  el  requisito  4,  ya  que  ningún  mensaje  está  dominado  para 
ningún  tipo  de  emisor. 


Vamos  a analizar  el  primero: 

[(Quiche, Quiche), (no, duelo), p=0.1,q]  para  cualquier  q>l/2 

• En  particular,  nada  garantiza  que  el  cobardica  vaya  a estar  mejor  por  tomar  quiché  (una  ganancia 
de  1 en  el  peor  de  los  casos)  que  por  tomar  cerveza  (ganancia  de  2 en  el  mejor). 

• Por  otra  parte,  la  conjetura  del  receptor  parece  sospechosa  por  el  siguiente  motivo: 

- Si  el  receptor  observa  que  el  emisor  elige  cerveza,  concluye  que  es  al  menos  tan  probable  que  el 
emisor  sea  cobardica  como  que  sea  malas  pulgas  (es  decir,  q>l/2),  a pesar  de: 

• A)  El  cobardica  no  puede  mejorar  de  ninguna  manera  su  ganancia  de  3 en  equilibrio  tomando 
cerveza  en  vez  de  quiche. 

• B)  El  malas  pulgas  podría  mejorar  su  ganancia  de  2 en  equilibrio  y recibir  una  ganancia  de  3 si  el 
receptor  mantuviera  la  conjetura  de  que  q<l/2. 


Dados  A)  y B),  cabría  esperar  que  el  malas  pulgas  escogiera  cerveza  y pronunciara  el 
siguiente  discurso: 

- Verme  escoger  cerveza  debería  convencerte  de  que  soy  del  tipo  "malas  pulgas": 

• Escoger  cerveza  no  podría  de  ninguna  manera  haber  mejorado  la  ganancia  del 
cobardica  por  A) 

• Si  escoger  cerveza  te  convenciera  de  que  soy  del  tipo  malas  pulgas,  entonces  hacerlo 
mejoraría  mi  ganancia,  por  B). 
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5 Juegos  dinámicos  con  información  incompleta 


• Si  este  discurso  fuera  creído,  establecería  que  q=0,  lo  que  es  incompatible  con  este 
equilibrio  bayesiano  perfecto  de  agrupación. 


Definición:  Dado  un  equilibrio  bayesiano  perfecto  en  un  juego  de  señalización,  el  mensaje 
m¡  de  M está  dominado  en  equilibrio  para  el  tipo  t¡  de  T si  la  ganancia  de  equilibrio  de  tir 
que 

denotamos  mediante  U*(ti),  es  más  alta  que  la  mayor  ganancia  posible  de  t¡  por  utilizar  m; 

• Por  lo  tanto,  se  debería  asignar  a q una  probabilidad  cero 

Requisito  5 de  señalización  ("El  criterio  intuitivo",  Cho  y Kreps  1987):  Si  el  conjunto  de 
información  que  sigue  a m;  está  fuera  de  la  trayectoria  de  equilibrio  y nq  está  dominado  en  equilibrio 
para  el  tipo  t,,  entonces  (si  es  posible)  la  conjetura  del  receptor  pi( t¡  I m)  debería  asignar 
probabilidad  cero  al  tipo  t¡.  (Esto  es  posible  siempre  que  mj  no  esté  dominado  para  todos  los  tipos  en 
T) 


Cerveza  y quiche  muestra  que  un  mensaje  mj  puede  estar  dominado  en  equilibrio  para  t¡ 
sin  estar  dominado  para  t¡.  Sin  embargo,  si  m¡  está  dominado  para  t¡,  mj  debe  estar 
dominado  en  equilibrio  para  t¡,  por  lo  que  imponer  el  requisito  5 de  señalización  hace 
que  el  requisito  4 sea  redundante. 
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